国際的な注目を集める国際コンピュータビジョン会議(ICCV)が2025年10月19日から23日にかけて、美しいハワイで開催されることが決定しました。アップル社はこの会議に、多数の重要な研究成果を発表する予定です。今回の会議は、コンピュータビジョン分野における先端技術と研究進展に焦点を当てており、アップルも例外ではありません。アップルは、マルチモーダルモデルや動画生成などのホットな分野での最新研究を披露する予定です。
図の出典:AIによって生成された画像、画像のライセンス提供者:Midjourney
アップル社は8本の論文を提出し、展示する予定です。その中には、「テキストからビデオへのアライメント評価方法」、「マルチモーダル大規模言語モデルにおける三次元空間理解能力」、および「拡張可能なビデオ生成方法」など、さまざまな重要なトピックが含まれています。これにより、アップルが人工知能とコンピュータビジョン分野において持つ深い実力と革新性が示されています。また、アップル機械学習応用研究部長のC. Thomas博士もシンポジウムスピーカーとして参加し、現在の技術トレンドについての見解を共有します。
注目すべき点として、アップルは「コンピュータビジョン分野における女性ワークショップ」にも参加し、女性の科技人材に対する支援と推進を強調しています。会議では、アップルの研究者であるPatricia Vitoria Carrera氏とTanya Glozman氏がメンターとして参加し、参加者と経験と洞察について深く交流します。
以下は、アップルが2025ICCVで展示する8本の論文タイトルです:
1. ETVA: テキストからビデオへのアライメント評価のための細粒度の質問生成と回答
2. MM-Spatial: マルチモーダル大規模言語モデルにおける三次元空間理解能力の探求
3. ナイーブなマルチモーダルモデルの拡張則に関する研究
4. 稳定拡散モデルが視覚的文脈学習において持つ隠れた優位性
5. STIV: スケーラブルなテキストと画像条件付きビデオ生成方法
6. UINavBench: インタラクティブなデジタルエージェントの包括的な評価フレームワーク
7. 多モーダルプロンプトに基づく統一オープンワールドセグメンテーション技術
8. UniVG: 画像生成と編集に使える汎用拡散モデル
アップルの参加は、コンピュータビジョンと人工知能分野における継続的な投資と革新を示しており、今後の技術発展に新たなインスピレーションをもたらすことを期待しています。