在近期舉辦的 Axios AI + 峯會上,谷歌 DeepMind 的首席執行官德米斯・哈薩比斯(Demis Hassabis)分享了他對未來一年 AI 領域的展望。他指出,2026 年將是多模態模型、互動視頻世界和更可靠的 AI 代理迅速發展的關鍵一年。
哈薩比斯強調,DeepMind 的最新 AI 模型 “Gemini” 已在多模態能力方面取得了顯著進展。他提到,該模型不僅能夠描述情節,還能深入理解場景的深層含義。例如,在影片《搏擊俱樂部》中,AI 將一個角色摘掉戒指的動作解讀爲對日常生活的哲學性放棄。這種深度理解使得 AI 能夠生成更復雜的輸出,比如信息圖表等,之前的技術無法實現這一點。
他還提到,AI 代理將在一年內能夠 “接近” 自主處理複雜任務的能力。這一進展符合他在 2024 年 5 月時提出的時間表。DeepMind 的目標是創建一個跨設備的通用助手,幫助用戶管理日常生活。爲實現這一目標,DeepMind 還在研發名爲 “Genie 3” 的 “世界模型”,這種模型能夠生成可互動的可探索視頻空間,讓用戶沉浸於虛擬世界中。
劃重點:
🌟 多模態模型的進步將推動 AI 理解和生成複雜內容的能力。
🛠️ AI 代理將在不久的將來接近自主處理複雜任務的水平。
🌍 DeepMind 正在研發互動視頻空間,爲用戶提供全新的沉浸式體驗。
