Apache 2.0 協議加持！谷歌 Gemma 4 正式開源：31B 參數性能直逼頭部大模型

4月3日凌晨，Google DeepMind 正式發佈新一代開源模型系列 Gemma4。此次更新距離上一代產品發佈整整一年，谷歌不僅在性能上實現了“代際跨越”，更在開源誠意上放出了大招:將許可證由自有協議徹底更換爲全球通用的 Apache2.0，這意味着開發者可以更自由地進行商用與二次開發。

規格全覆蓋:從手機端到工作站的“四劍客”

Gemma4 此次一口氣推出了四款不同規格的模型，實現了全場景覆蓋:

31B Dense（旗艦版）:310億全激活參數，支持256K 超長上下文。在 Arena AI 開源排行榜中高居第三，未量化版本僅需一張 H100即可運行。

26B A4B MoE（性價比之王）: 採用混合專家架構，總參數252億，激活參數僅爲38億。其推理速度接近4B 模型，但質量遠超同級別產品，位列排行榜第六。

E4B & E2B（端側精英）: 專爲手機和嵌入式設備優化。通過 Per-Layer Embeddings 技術，有效參數分別壓縮至45億和23億。其中 E2B 在部分設備上的內存佔用可壓至1.5GB 以下。

性能狂飆:代碼與數學能力實現代際飛躍

相比上一代 Gemma327B，Gemma4 的核心指標提升堪稱驚人:

數學競賽: AIME2026測試從20.8% 飆升至 89.2%。

編程進化: Codeforces ELO 評分從110拉昇至 2150，在 LiveCodeBench 測試中從29.1% 漲至80.0%，成爲目前最可用的開源編程輔助模型之一。

綜合推理: 研究生級科學問答（GPQA Diamond）得分從42.4% 幾乎翻倍至 84.3%。

多語言能力: 原生支持140多種語言，MMMLU 評分達88.4%。

核心特性:內置“思考模式”與 Agent 基因

Gemma4 不僅僅是參數的增長，更在交互邏輯上向旗艦 Gemini 看齊:

Thinking Mode: 內置可開關的思考模式，模型在輸出答案前會先進行內部推理，極大提升了多步驟規劃類任務的準確性。

原生 Agent 支持: 支持函數調用和結構化 JSON 輸出。谷歌同步發佈了開源 Agent 開發工具包（ADK），讓端側模型也能變身“智能體”。

深度多模態: 所有版本均支持圖像和視頻輸入，小模型版本甚至額外自帶了音頻編碼器，支持語音識別與翻譯。

行業觀察:開源賽道的“權力重組”

在過去的一年裏，國內開源模型（如 DeepSeek、Qwen、GLM 等）迭代極快，谷歌在開源領域的影響力一度被削弱。Gemma4 的發佈，標誌着谷歌正通過“極致的端側工程化”與“更徹底的協議開放”重回主戰場。

結語:當大廠開始講“誠意”

從自定義協議轉向 Apache2.0，谷歌用實際行動回答了開源誠意的問題。當31B 規模的模型能跑出接近閉源旗艦的性能，且能流暢運行在消費級顯卡甚至手機上時，全球 AI 開發者的創作邊界將再次被拓寬。

Apache 2.0 協議加持！谷歌 Gemma 4 正式開源：31B 參數性能直逼頭部大模型

規格全覆蓋:從手機端到工作站的“四劍客”

性能狂飆:代碼與數學能力實現代際飛躍

核心特性:內置“思考模式”與 Agent 基因

行業觀察:開源賽道的“權力重組”

相關推薦

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

蘋果本地 AI 強勢逆襲！oMLX 0.3.9 重磅更新：Gemma 4 視覺加速 + 一鍵 Copilot，雲端大模型優勢被全面拉平

谷歌Gemma4 推理速度狂飆 3 倍，離線大模型時代真的來了

爆文預訂：告別 Token 焦慮！瀏覽器本地跑 Gemma 4，手繪流程圖從此全免費

谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力

Apache 2.0 協議加持！谷歌 Gemma 4 正式開源：31B 參數性能直逼頭部大模型

規格全覆蓋:從手機端到工作站的“四劍客”

性能狂飆:代碼與數學能力實現代際飛躍

核心特性:內置“思考模式”與 Agent 基因

行業觀察:開源賽道的“權力重組”

相關推薦

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

蘋果本地 AI 強勢逆襲！oMLX 0.3.9 重磅更新：Gemma 4 視覺加速 + 一鍵 Copilot，雲端大模型優勢被全面拉平

谷歌Gemma4 推理速度狂飆 3 倍，離線大模型時代真的來了

爆文預訂：告別 Token 焦慮！瀏覽器本地跑 Gemma 4，手繪流程圖從此全免費

​谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力

谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力