在全球科技界備受矚目的國際計算機視覺大會(ICCV)即將於2025年10月19日至23日在美麗的檀香山召開,蘋果公司確認將攜帶多項重要研究成果亮相這一盛會。此次大會旨在聚焦計算機視覺領域的前沿技術和研究進展,蘋果也不例外,將展示他們在多模態模型和視頻生成等熱點領域的最新研究。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
蘋果公司將提交併展示八篇論文,涵蓋多種重要議題。其中,涉及的主題包括 “文本到視頻對齊的評估方法”、“多模態大語言模型中的三維空間理解能力”,以及 “可擴展的視頻生成方法” 等,展現出蘋果在人工智能和計算機視覺領域的深厚實力和創新能力。此外,蘋果機器學習應用研究部經理 C. Thomas 博士也將作爲主旨演講者參與大會,分享他對當前技術趨勢的見解。
值得注意的是,蘋果還將參與 “計算機視覺領域女性研討會”,強調對女性科技人才的支持與倡導。會議中,蘋果的研究人員 Patricia Vitoria Carrera 和 Tanya Glozman 將擔任導師,與與會者深入交流經驗與見解。
以下是蘋果將在2025ICCV 大會上展示的八篇論文題目:
1. ETVA:通過細粒度問題生成與回答實現文本到視頻對齊的評估
2. MM-Spatial:探索多模態大語言模型中的三維空間理解能力
3. 原生多模態模型的擴展規律研究
4. 穩定擴散模型在視覺上下文學習中的隱性優勢
5. STIV:可擴展的文本與圖像條件化視頻生成方法
6. UINavBench:交互式數字智能體綜合評估框架
7. 基於多模態提示的統一開放世界分割技術
8. UniVG:用於統一圖像生成與編輯的通用擴散模型
蘋果的參與標誌着其在計算機視覺和人工智能領域的持續投入和創新,期待他們在大會上的精彩表現,爲未來的科技發展帶來新的啓示。