4月3日凌晨,Google DeepMind 正式發佈新一代開源模型系列 Gemma4。此次更新距離上一代產品發佈整整一年,谷歌不僅在性能上實現了“代際跨越”,更在開源誠意上放出了大招:將許可證由自有協議徹底更換爲全球通用的 Apache2.0,這意味着開發者可以更自由地進行商用與二次開發。

1.jpg

規格全覆蓋:從手機端到工作站的“四劍客”

Gemma4 此次一口氣推出了四款不同規格的模型,實現了全場景覆蓋:

31B Dense(旗艦版):310億全激活參數,支持256K 超長上下文。在 Arena AI 開源排行榜中高居第三,未量化版本僅需一張 H100即可運行。

26B A4B MoE(性價比之王): 採用混合專家架構,總參數252億,激活參數僅爲38億。其推理速度接近4B 模型,但質量遠超同級別產品,位列排行榜第六。

E4B & E2B(端側精英): 專爲手機和嵌入式設備優化。通過 Per-Layer Embeddings 技術,有效參數分別壓縮至45億和23億。其中 E2B 在部分設備上的內存佔用可壓至1.5GB 以下。

2.png

性能狂飆:代碼與數學能力實現代際飛躍

相比上一代 Gemma327B,Gemma4 的核心指標提升堪稱驚人:

數學競賽: AIME2026測試從20.8% 飆升至 89.2%

編程進化: Codeforces ELO 評分從110拉昇至 2150,在 LiveCodeBench 測試中從29.1% 漲至80.0%,成爲目前最可用的開源編程輔助模型之一。

綜合推理: 研究生級科學問答(GPQA Diamond)得分從42.4% 幾乎翻倍至 84.3%

多語言能力: 原生支持140多種語言,MMMLU 評分達88.4%。

3.png

核心特性:內置“思考模式”與 Agent 基因

Gemma4 不僅僅是參數的增長,更在交互邏輯上向旗艦 Gemini 看齊:

Thinking Mode: 內置可開關的思考模式,模型在輸出答案前會先進行內部推理,極大提升了多步驟規劃類任務的準確性。

原生 Agent 支持: 支持函數調用和結構化 JSON 輸出。谷歌同步發佈了開源 Agent 開發工具包(ADK),讓端側模型也能變身“智能體”。

深度多模態: 所有版本均支持圖像和視頻輸入,小模型版本甚至額外自帶了音頻編碼器,支持語音識別與翻譯。

行業觀察:開源賽道的“權力重組”

在過去的一年裏,國內開源模型(如 DeepSeek、Qwen、GLM 等)迭代極快,谷歌在開源領域的影響力一度被削弱。Gemma4 的發佈,標誌着谷歌正通過“極致的端側工程化”與“更徹底的協議開放”重回主戰場。

結語:當大廠開始講“誠意”

從自定義協議轉向 Apache2.0,谷歌用實際行動回答了開源誠意的問題。當31B 規模的模型能跑出接近閉源旗艦的性能,且能流暢運行在消費級顯卡甚至手機上時,全球 AI 開發者的創作邊界將再次被拓寬。