Alphabet旗下谷歌正式發佈Gemini3,首次提供100萬tokens上下文窗口,支持文本、圖像、視頻與代碼原生多模態推理。官方稱,Gemini3Pro在GPQA Diamond研究生級測試獲91.9%準確率,在LMArena以1501Elo登頂,超越GPT-5.1與Claude4.5,成爲目前公開榜單最高分模型。

Gemini3採用全新Deep Think增強推理模式,通過“思維簽名”與“思考等級”將推理鏈產品化,ARC-AGI-2得分45.1%,在多步邏輯、事實準確性與科學圖表理解維度刷新SOTA。谷歌同步推出Google Antigravity開發平臺,支持“代理式編碼”與“可視化編碼”,LiveCodeBench Pro Elo2439,Terminal-Bench2.0終端操作準確率54.2%,可自主完成數據爬取、分析、報告與部署全鏈路。

Gemini3即日起向Google AI Ultra訂閱用戶開放,未來幾周陸續覆蓋Gemini應用、AI Mode搜索與企業級Vertex AI。谷歌表示,模型在自研TPU v6Pods訓練,配合90%搜索市佔與20億“AI概覽”月活,將加速AI從實驗室走向生產線。