近日,谷歌在開發者平臺 Google AI Studio 及 Gemini 應用程序上發佈了其最新的人工智能推理模型 ——Gemini2.5。此模型具備停下來 “思考” 的能力,標誌着人工智能技術的新進步。谷歌還推出了 Gemini2.5Pro Experimental,這款多模式推理 AI 模型被認爲是迄今爲止最智能的。

Gemini2.5的發佈是谷歌針對每月20美元的 Gemini Advanced 訂閱者的一項新服務,用戶可以體驗到其強大的推理能力。

QQ_1742953421808.png

自從2024年9月 OpenAI 發佈首個 AI 推理模型以來,各大科技公司如 Anthropic、DeepSeek、谷歌和 xAI 等紛紛推出了各自的推理模型,以期在智能化水平上相互競爭。推理技術的應用使得這些模型在數學和編程任務上表現得更加出色,推動了人工智能的進一步發展。

谷歌聲稱,Gemini2.5Pro 在多個基準測試中超越了其之前的 AI 模型及一些領先競爭對手。例如,在名爲 Aider Polyglot 的代碼編輯評估中,Gemini2.5Pro 獲得了68.6% 的高分,超過了 OpenAI、Anthropic 及 DeepSeek 的頂尖 AI 模型。

QQ_1742953507187.png

而在軟件開發能力的測試中,雖然其得分爲63.8%,低於 Anthropic 的 Claude3.7Sonnet 的70.3%,但仍然優於 OpenAI 的 o3-mini 和 DeepSeek 的 R1。

此外,在 “人類的最後考試” 中,Gemini2.5Pro 的得分爲18.8%,同樣表現優於多家競爭對手。谷歌表示,Gemini2.5Pro 配備了100萬個 token 的上下文窗口,這使得 AI 模型能夠在一次提示中處理大約75萬個單詞,長度甚至超過了整個《指環王》系列。未來,谷歌計劃推出200萬個 token 的上下文窗口,進一步提升模型的能力。

QQ_1742953530355.png

值得注意的是,谷歌在推理模型方面的探索並非首次,早在去年12月,公司就曾推出過 Gemini 的 “思考” 版本。但顯然,Gemini2.5是谷歌目前對 OpenAI o 系列模型最有力的競爭者。關於 Gemini2.5Pro 的 API 定價,谷歌尚未透露更多信息。

官方博客:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#advanced-coding

劃重點:

🌟 Gemini2.5和 Pro 版本具備推理能力,標誌着 AI 技術新進展。  

🚀 在多個基準測試中,Gemini2.5Pro 表現優於多家競爭對手。  

📈 將推出200萬個 token 的上下文窗口,進一步提升 AI 模型處理能力。