谷歌正式發佈 Gemma4開源大模型:涵蓋四種規格，31B 版本位列全球開源榜單第三

北京時間4月3日凌晨，谷歌正式發佈開源大模型 Gemma4，憑藉“單位參數智能”的突破性提升，定義了開源模型輔助智能體工作流的新標準。

該系列包含高效版 E2B（2.3B）、E4B(4.5B)以及高性能版26B MoE 與31B 稠密模型。作爲基於 Gemini3技術棧構建的最新成果，Gemma4全系支持多模態輸入(圖片與視頻)，其中 E2B 與 E4B 更是原生支持語音輸入，實現了端側實時的語音理解。

技術架構上，大參數模型通過優化實現了極高的硬件效率，31B 稠密版在 Arena AI 文本榜單中位列開源模型全球第三，26B MoE 版位居第六，其邏輯推理與函數調用能力足以驅動複雜的自主智能體。

在本地部署方面，Gemma4顯著降低了前沿 AI 能力的准入門檻。31B 模型的非量化權重可運行於單塊80GB H100顯卡，量化版則兼容消費級顯卡。針對移動端與 IoT 設備，E2B 和 E4B 模型通過創新的 PLE 嵌入技術與128K 長上下文支持，在 Raspberry Pi 及智能手機上實現了低延遲的邏輯處理。

此次發佈不僅展示了谷歌在開源生態的深厚積澱，更通過 Apache2.0協議的開放姿態，爲全球開發者提供了構建本地化、高隱私性 AI 應用的底座。

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

MiniMax稀宇科技於2026年6月1日發佈新一代前沿大模型M3，這是國內首個集成頂尖編程、1M超長上下文及原生多模態能力的開源模型，對標海外閉源旗艦。針對複雜智能體任務的上下文擴展瓶頸，M3自主研發稀疏注意力架構（MSA），實現更精確的KV分塊與算子層優化，計算速度較同類開源方案提升4倍以上，在1M上下文下每Token計算量顯著降低。

爆文預訂：告別 Token 焦慮！瀏覽器本地跑 Gemma 4，手繪流程圖從此全免費

移動端運行大模型已成常態，而瀏覽器內置強大AI能力成爲新趨勢。開發者利用Google的TurboQuant算法，成功將Gemma4模型部署到瀏覽器中，用戶無需API配置或訂閱費用，即可在本地實現流暢AI交互。核心是TurboQuant算法帶來的記憶革命。

谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力

谷歌發佈Gemma4系列開源模型，實現AI能力輕量化突破。其中一款僅激活3.8億參數，性能卻超越參數規模20倍的大型模型，使強大AI可輕鬆部署於手機和輕薄筆記本。該系列包含2.3B和4.5B等不同參數規模的模型，推動人工智能服務更便捷普及。

谷歌正式發佈 Gemma4開源大模型:涵蓋四種規格，31B 版本位列全球開源榜單第三

相關推薦

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

蘋果本地 AI 強勢逆襲！oMLX 0.3.9 重磅更新：Gemma 4 視覺加速 + 一鍵 Copilot，雲端大模型優勢被全面拉平

谷歌Gemma4 推理速度狂飆 3 倍，離線大模型時代真的來了

爆文預訂：告別 Token 焦慮！瀏覽器本地跑 Gemma 4，手繪流程圖從此全免費

谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力

谷歌正式發佈 Gemma4開源大模型:涵蓋四種規格，31B 版本位列全球開源榜單第三

相關推薦

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

蘋果本地 AI 強勢逆襲！oMLX 0.3.9 重磅更新：Gemma 4 視覺加速 + 一鍵 Copilot，雲端大模型優勢被全面拉平

谷歌Gemma4 推理速度狂飆 3 倍，離線大模型時代真的來了

爆文預訂：告別 Token 焦慮！瀏覽器本地跑 Gemma 4，手繪流程圖從此全免費

​谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力

谷歌 Gemma 4 全面開源：小型模型展現超強 AI 能力