image.png

谷歌今日宣佈推出其最新一代人工智能模型 Gemini 2.0,這是該公司迄今爲止最強大的AI模型。這一重大升級不僅在性能上有顯著提升,更標誌着人工智能向代理時代邁進的重要一步。

根據谷歌和Alphabet首席執行官Sundar Pichai的介紹,Gemini 2.0在多模態能力和原生工具使用方面都實現了突破性進展。新模型不僅能夠理解和處理文本、圖像、視頻、音頻等多種形式的輸入,還首次支持原生圖像生成和文本轉語音等多模態輸出功能。

"如果說Gemini 1.0是關於組織和理解信息的,那麼Gemini 2.0就是爲了讓信息更加有用,"Pichai表示。目前,該模型已經開始向開發者和可信測試人員開放使用。

技術創新與性能提升

谷歌DeepMind首席執行官Demis Hassabis透露,首批發布的是Gemini 2.0 Flash實驗版本。這一版本在保持低延遲的同時,性能得到了顯著提升。值得注意的是,2.0 Flash在關鍵基準測試中的表現甚至超過了1.5Pro,響應速度提高了一倍。

新模型運行在谷歌第六代TPU Trillium硬件平臺上,這也是支持Gemini2.0百分之百訓練和推理的基礎設施。目前,這一平臺已經向客戶開放使用。

image.png

實際應用與產品整合

谷歌計劃迅速將Gemini 2.0融入其產品生態系統。從即日起,全球Gemini用戶可以通過網頁版選擇使用2.0Flash實驗版本,移動應用版本也將很快推出。此外,谷歌搜索的AI概覽功能也將整合2.0的高級推理能力,以解決更復雜的主題和多步驟問題。

值得關注的是,谷歌還推出了名爲"Deep Research"的新功能,這項功能將在Gemini Advanced中提供,能夠充當研究助手,探索複雜主題並自動生成報告。

探索AI代理的未來

在此次發佈中,谷歌還展示了幾個基於Gemini 2.0構建的研究原型項目:

  • Project Astra:這是一個通用AI助手原型,具備多語言對話能力,可以使用谷歌搜索、鏡頭和地圖等工具,並具有長達10分鐘的會話記憶功能。
  • Project Mariner:這是一個瀏覽器交互原型,能夠理解和推理網頁上的各類信息,並通過Chrome擴展程序協助用戶完成任務。在WebVoyager基準測試中,它實現了83.5%的最佳工作成果。
  • Jules:這是一個面向開發者的AI代碼代理,可以直接集成到GitHub工作流程中,協助解決問題和執行任務。

安全性與負責任發展

在推進這些創新的同時,谷歌特別強調了安全性和負責任發展的重要性。公司採取了多項措施確保AI代理的安全使用:

  • 與責任與安全委員會(RSC)合作,識別和了解潛在風險
  • 改進AI輔助紅隊方法,提升風險評估和緩解能力
  • 爲多模態輸入輸出建立安全評估和訓練機制
  • 在Project Mariner中加入防範惡意指令的保護機制

未來展望

這次Gemini 2.0的發佈被視爲AI發展的重要里程碑。通過將先進的多模態能力與代理功能相結合,谷歌展示了其在推動AI技術發展方面的野心。隨着這些新功能逐步整合到各個產品中,用戶將能夠體驗到更智能、更實用的AI助手服務。

然而,谷歌也承認,AI代理技術仍處於早期階段,需要繼續通過與可信測試者的合作來收集反饋,不斷改進和完善這項技術。公司承諾將繼續以負責任的方式推進AI技術的發展,在探索新可能性的同時確保安全和道德標準。

詳細信息請查看:https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents