谷歌於2025年1月22日正式發佈了其 Gemini2.0Flash Thinking 推理模型的增強版,再次奪回 Chatbot Arena 的榜首。此版本的升級主要集中在長上下文的處理能力上,能夠支持高達1M token 的輸入,爲用戶在處理長篇文本時提供了更深入的分析能力。

谷歌 AI 負責人 Jeff Dean 在發佈會上表示,此次實驗性更新旨在提高模型的可靠性,並減少模型生成的思想與最終答案之間的矛盾。Gemini2.0Flash Thinking 不僅延續了原有版本的優點,還新增了基於思維(thoughts)增強推理能力的功能,表現出色。

在技術層面,Gemini2.0Flash Thinking 實現了兩大突破:首先,能夠處理高達1M token 的長上下文,這對於複雜的多輪對話和推理過程至關重要;其次,模型在自我糾錯方面表現顯著,能夠在對話中保持連貫性並靈活應用之前積累的信息。這意味着用戶在與模型互動時,可以體驗到更爲自然和一致的對話過程。

在一場演示中,Jeff Dean 展示了該模型如何解決物理問題並解釋推理過程,令人印象深刻。而且,參與者反饋稱,這款最新模型的實際體驗甚至比演示中更爲迅速。
除了長上下文處理能力,Gemini2.0Flash Thinking 在數學能力測試、科學能力測試和多模態推理能力上也有顯著提升,尤其是在數學方面成績提升了54%。這一系列優異的表現讓人們對該模型的未來充滿期待。

進入交互界面,用戶可以在 “Google AI Studio” 平臺上獲得全面的模型功能,包括創建提示詞、實時對話以及開發應用程序等。雖然當前界面的功能較爲分散,但谷歌計劃在模型正式發佈後,提供更詳細的技術報告和用戶指引,以便改善用戶體驗。
展望未來,谷歌的開發團隊正在積極探索3D 數據的處理能力,顯示出他們對持續創新的堅定信念。可以預見,谷歌在 AI 領域的下一個突破正呼之欲出,值得我們持續關注。
試用鏈接:https://aistudio.google.com/prompts/new_chat
