谷歌發佈Gemini 3：百萬上下文對標GPT-5.1，登頂LMArena

Alphabet旗下谷歌正式發佈Gemini3，首次提供100萬tokens上下文窗口，支持文本、圖像、視頻與代碼原生多模態推理。官方稱，Gemini3Pro在GPQA Diamond研究生級測試獲91.9%準確率，在LMArena以1501Elo登頂，超越GPT-5.1與Claude4.5，成爲目前公開榜單最高分模型。

Gemini3採用全新Deep Think增強推理模式，通過“思維簽名”與“思考等級”將推理鏈產品化，ARC-AGI-2得分45.1%，在多步邏輯、事實準確性與科學圖表理解維度刷新SOTA。谷歌同步推出Google Antigravity開發平臺，支持“代理式編碼”與“可視化編碼”，LiveCodeBench Pro Elo2439，Terminal-Bench2.0終端操作準確率54.2%，可自主完成數據爬取、分析、報告與部署全鏈路。

Gemini3即日起向Google AI Ultra訂閱用戶開放，未來幾周陸續覆蓋Gemini應用、AI Mode搜索與企業級Vertex AI。谷歌表示，模型在自研TPU v6Pods訓練，配合90%搜索市佔與20億“AI概覽”月活，將加速AI從實驗室走向生產線。

谷歌搜索 AI 概覽準確率僅 90%，易受虛假信息影響

《紐約時報》報道稱，谷歌AI概覽功能準確率約90%。基於谷歌每年超5萬億次搜索量，這意味着每小時可能產生超5700萬條錯誤答案，每分鐘近百萬條錯誤信息。初創公司Oumi評估顯示，谷歌Gemini模型準確率從去年10月的85%提升至今年2月的91%。

谷歌發佈Gemini 3：百萬上下文對標GPT-5.1，登頂LMArena

相關推薦

DeepMind 首席執行官痛批“AI 裁員論”：用 AI 取代開發者是重大錯誤

谷歌搜索 AI 概覽準確率僅 90%，易受虛假信息影響

Google NotebookLM 推出“電影級視頻概覽”新功能

瀏覽器變身AI管家：Gemini 3 全面接入 Chrome 開啓 Agent 時代

谷歌搜索迎來重大變革:從“鏈接索引”轉向“AI 對話中心”

谷歌發佈Gemini 3：百萬上下文對標GPT-5.1，登頂LMArena

相關推薦

DeepMind 首席執行官痛批“AI 裁員論”：用 AI 取代開發者是重大錯誤

​谷歌搜索 AI 概覽準確率僅 90%，易受虛假信息影響

Google NotebookLM 推出“電影級視頻概覽”新功能

瀏覽器變身AI管家：Gemini 3 全面接入 Chrome 開啓 Agent 時代

谷歌搜索迎來重大變革:從“鏈接索引”轉向“AI 對話中心”

谷歌搜索 AI 概覽準確率僅 90%，易受虛假信息影響