谷歌於當地時間 6 月 10 日正式推出了一款名爲DiffusionGemma的實驗性開源模型。這款模型的一大亮點在於其採用了文本擴散架構(Text-to-text diffusion),旨在通過全新的路徑提升人工智能的生成效率。
在性能測試中,DiffusionGemma展現出了獨特的技術優勢。得益於其架構設計,該模型在專用GPU上的文本生成速度,相比傳統的自迴歸大語言模型最高提升了 4 倍。不過,谷歌官方對此保持了客觀的評價,明確指出DiffusionGemma目前定位爲面向研究者與開發者的實驗性產品。在模型輸出質量方面,它尚無法與標準的Gemma4 相比,因此現階段仍建議在生產環境中使用標準版本。
從應用場景來看,該模型的速度紅利有着明確的邊界。其性能提升主要集中在本地設備運行及低併發的推理場景中。而在面對高併發的雲端部署需求時,這種架構帶來的速度優勢則相對有限。
爲了鼓勵技術社區的探索與共創,谷歌將該模型以Apache 2. 0 許可證向公衆開放。此舉爲開發者提供了更低門檻的技術驗證空間,也爲AI領域探索非自迴歸架構的推理潛力提供了新的實驗樣本。儘管當前仍處於早期探索階段,但DiffusionGemma無疑爲未來提升大模型推理效率,提供了一個值得關注的技術思路。
