在2025年5月20日的Google I/O開發者大會上,谷歌DeepMind正式推出了Gemini2.5Pro Deep Think模式,這一實驗性增強推理模式爲AI處理複雜任務樹立了新標杆。Deep Think模式通過並行推理技術,使Gemini2.5Pro在數學、編碼和多模態推理等領域的表現達到行業領先水平。

並行推理技術,顯著提升複雜任務表現

Deep Think模式採用前沿的並行推理技術,允許模型在生成響應前探索多個假設路徑,從而提升答案的準確性和深度。谷歌表示,該模式在2025年美國數學奧林匹克(USAMO)測試中獲得優異成績,在競爭性編程基準LiveCodeBench上名列前茅,並在多模態推理測試MMMU中取得84%的驚人得分。這些結果表明,Deep Think模式特別適合解決需要多步推理的高難度數學和編碼問題,媲美甚至超越了OpenAI的o1-pro等競品。

image.png

模塊化控制與開發者友好設計

Deep Think模式引入了**思考預算(Thinking Budget)功能,允許開發者通過調整推理過程中使用的令牌數量,靈活平衡響應質量、延遲和成本。這一功能使Gemini2.5Pro能夠適配從快速原型設計到深度分析的多種場景。此外,谷歌在Gemini API和Vertex AI中新增了思考摘要(Thought Summaries)**功能,以清晰的格式展示模型的推理過程,便於開發者調試和優化交互體驗。

初始面向受信任測試者,安全優先

目前,Deep Think模式僅通過Gemini API向受信任測試者開放,谷歌強調將進行額外的安全評估,以確保模型在廣泛應用前的穩健性。網絡討論中,開發者對該模式的推理能力表示高度期待,但也指出其在實際應用中的表現需進一步驗證。谷歌計劃在未來幾周內通過Google AI Studio和Vertex AI逐步擴展其可用性,預計6月初實現更廣泛的部署。

Gemini2.5Pro Deep Think模式的發佈標誌着谷歌在AI推理領域的重大突破,其並行推理和模塊化控制設計爲開發者提供了更高效的工具。相較於傳統的單一推理路徑,Deep Think模式的創新方法有望在學術研究、軟件開發和數據分析等領域掀起新風潮。AIbase將持續跟蹤該模式的實際應用效果及用戶反饋,期待其在推動AI技術邊界方面的表現。