4月3日凌晨,Google DeepMind 正式發佈新一代開源模型系列

規格全覆蓋:從手機端到工作站的“四劍客”
31B Dense(旗艦版):310億全激活參數,支持256K 超長上下文。在 Arena AI 開源排行榜中高居第三,未量化版本僅需一張 H100即可運行。
26B A4B MoE(性價比之王): 採用混合專家架構,總參數252億,激活參數僅爲38億。其推理速度接近4B 模型,但質量遠超同級別產品,位列排行榜第六。
E4B & E2B(端側精英): 專爲手機和嵌入式設備優化。通過 Per-Layer Embeddings 技術,有效參數分別壓縮至45億和23億。其中 E2B 在部分設備上的內存佔用可壓至1.5GB 以下。

性能狂飆:代碼與數學能力實現代際飛躍
相比上一代 Gemma327B,
數學競賽: AIME2026測試從20.8% 飆升至 89.2%。
編程進化: Codeforces ELO 評分從110拉昇至 2150,在 LiveCodeBench 測試中從29.1% 漲至80.0%,成爲目前最可用的開源編程輔助模型之一。
綜合推理: 研究生級科學問答(GPQA Diamond)得分從42.4% 幾乎翻倍至 84.3%。
多語言能力: 原生支持140多種語言,MMMLU 評分達88.4%。

核心特性:內置“思考模式”與 Agent 基因
Thinking Mode: 內置可開關的思考模式,模型在輸出答案前會先進行內部推理,極大提升了多步驟規劃類任務的準確性。
原生 Agent 支持: 支持函數調用和結構化 JSON 輸出。谷歌同步發佈了開源 Agent 開發工具包(ADK),讓端側模型也能變身“智能體”。
深度多模態: 所有版本均支持圖像和視頻輸入,小模型版本甚至額外自帶了音頻編碼器,支持語音識別與翻譯。
行業觀察:開源賽道的“權力重組”
在過去的一年裏,國內開源模型(如 DeepSeek、Qwen、GLM 等)迭代極快,谷歌在開源領域的影響力一度被削弱。
結語:當大廠開始講“誠意”
從自定義協議轉向 Apache2.0,谷歌用實際行動回答了開源誠意的問題。當31B 規模的模型能跑出接近閉源旗艦的性能,且能流暢運行在消費級顯卡甚至手機上時,全球 AI 開發者的創作邊界將再次被拓寬。
