谷歌發佈 Gemini 2.0：邁向AI代理新時代所有Gemini用戶可用

谷歌今日宣佈推出其最新一代人工智能模型 Gemini 2.0，這是該公司迄今爲止最強大的AI模型。這一重大升級不僅在性能上有顯著提升，更標誌着人工智能向代理時代邁進的重要一步。

根據谷歌和Alphabet首席執行官Sundar Pichai的介紹，Gemini 2.0在多模態能力和原生工具使用方面都實現了突破性進展。新模型不僅能夠理解和處理文本、圖像、視頻、音頻等多種形式的輸入，還首次支持原生圖像生成和文本轉語音等多模態輸出功能。

"如果說Gemini 1.0是關於組織和理解信息的，那麼Gemini 2.0就是爲了讓信息更加有用，"Pichai表示。目前，該模型已經開始向開發者和可信測試人員開放使用。

谷歌DeepMind首席執行官Demis Hassabis透露，首批發布的是Gemini 2.0 Flash實驗版本。這一版本在保持低延遲的同時，性能得到了顯著提升。值得注意的是，2.0 Flash在關鍵基準測試中的表現甚至超過了1.5Pro，響應速度提高了一倍。

新模型運行在谷歌第六代TPU Trillium硬件平臺上，這也是支持Gemini2.0百分之百訓練和推理的基礎設施。目前，這一平臺已經向客戶開放使用。

谷歌計劃迅速將Gemini 2.0融入其產品生態系統。從即日起，全球Gemini用戶可以通過網頁版選擇使用2.0Flash實驗版本，移動應用版本也將很快推出。此外，谷歌搜索的AI概覽功能也將整合2.0的高級推理能力，以解決更復雜的主題和多步驟問題。

值得關注的是，谷歌還推出了名爲"Deep Research"的新功能，這項功能將在Gemini Advanced中提供，能夠充當研究助手，探索複雜主題並自動生成報告。

在此次發佈中，谷歌還展示了幾個基於Gemini 2.0構建的研究原型項目:

Project Astra:這是一個通用AI助手原型，具備多語言對話能力，可以使用谷歌搜索、鏡頭和地圖等工具，並具有長達10分鐘的會話記憶功能。
Project Mariner:這是一個瀏覽器交互原型，能夠理解和推理網頁上的各類信息，並通過Chrome擴展程序協助用戶完成任務。在WebVoyager基準測試中，它實現了83.5%的最佳工作成果。
Jules:這是一個面向開發者的AI代碼代理，可以直接集成到GitHub工作流程中，協助解決問題和執行任務。

在推進這些創新的同時，谷歌特別強調了安全性和負責任發展的重要性。公司採取了多項措施確保AI代理的安全使用:

這次Gemini 2.0的發佈被視爲AI發展的重要里程碑。通過將先進的多模態能力與代理功能相結合，谷歌展示了其在推動AI技術發展方面的野心。隨着這些新功能逐步整合到各個產品中，用戶將能夠體驗到更智能、更實用的AI助手服務。

然而，谷歌也承認，AI代理技術仍處於早期階段，需要繼續通過與可信測試者的合作來收集反饋，不斷改進和完善這項技術。公司承諾將繼續以負責任的方式推進AI技術的發展，在探索新可能性的同時確保安全和道德標準。

詳細信息請查看：https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents

Monday.com 裁員 630 人，聚焦人工智能戰略