谷歌發佈DiffusionGemma：嘗試用文本擴散架構提速AI推理

谷歌於當地時間 6 月 10 日正式推出了一款名爲DiffusionGemma的實驗性開源模型。這款模型的一大亮點在於其採用了文本擴散架構（Text-to-text diffusion），旨在通過全新的路徑提升人工智能的生成效率。

在性能測試中，DiffusionGemma展現出了獨特的技術優勢。得益於其架構設計，該模型在專用GPU上的文本生成速度，相比傳統的自迴歸大語言模型最高提升了 4 倍。不過，谷歌官方對此保持了客觀的評價，明確指出DiffusionGemma目前定位爲面向研究者與開發者的實驗性產品。在模型輸出質量方面，它尚無法與標準的Gemma4 相比，因此現階段仍建議在生產環境中使用標準版本。

從應用場景來看，該模型的速度紅利有着明確的邊界。其性能提升主要集中在本地設備運行及低併發的推理場景中。而在面對高併發的雲端部署需求時，這種架構帶來的速度優勢則相對有限。

爲了鼓勵技術社區的探索與共創，谷歌將該模型以Apache 2. 0 許可證向公衆開放。此舉爲開發者提供了更低門檻的技術驗證空間，也爲AI領域探索非自迴歸架構的推理潛力提供了新的實驗樣本。儘管當前仍處於早期探索階段，但DiffusionGemma無疑爲未來提升大模型推理效率，提供了一個值得關注的技術思路。

谷歌聯合英偉達發佈開源模型DiffusionGemma:引入擴散機制，單卡推理提速4倍

谷歌於2026年6月發佈開源語言模型DiffusionGemma，首次將圖像AI擴散機制引入文本生成，打破傳統逐字自迴歸範式。該模型從隨機噪聲迭代優化，並行輸出256個詞塊。經英偉達優化，在單GPU單用戶模式下，運行速度比同類傳統模型快近四倍，如H100顯卡處理單請求時表現顯著提升。

Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來

今日，開源模型Step3.7Flash正式發佈，以Apache2.0協議開放權重，直擊Agent時代效率、可靠性與多模態執行等核心痛點。在多項基準測試中表現突出：ClawEval-1.1獲67.1分排名第一，SimpleVQA Search得79.2分居首，SWE-PRO以56.3分位列第二，V* Python得分高達95.3，展現了在Agent任務、代碼生成及視覺執行等領域的實戰能力。

李開復：開源模型是實現“AI主權”的更優路徑

李開復提出“AI主權”概念，強調其涉及技術控制、數據安全及模型與本土文化法律的適配。他認爲各國不必盲目重造OpenAI，閉源自研成本高且不現實。對資源有限的國家和企業，基於開源模型構建本地化體系是更可行的“第三條路”。

谷歌發佈DiffusionGemma：嘗試用文本擴散架構提速AI推理

相關推薦

資本市場新寵：智譜市值突破萬億，國產大模型迎來高光時刻

智譜GLM-5. 2 全量開源，力推前沿智能全民化

谷歌聯合英偉達發佈開源模型DiffusionGemma:引入擴散機制，單卡推理提速4倍

Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來

李開復：開源模型是實現“AI主權”的更優路徑

谷歌發佈DiffusionGemma：嘗試用文本擴散架構提速AI推理

相關推薦

資本市場新寵：智譜市值突破萬億，國產大模型迎來高光時刻

智譜GLM-5. 2 全量開源，力推前沿智能全民化

谷歌聯合英偉達發佈開源模型DiffusionGemma:引入擴散機制，單卡推理提速4倍

​Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來

李開復：開源模型是實現“AI主權”的更優路徑

Step 3.7 Flash 重磅發佈：Agent 效率新時代真正到來