グーグルは現地時間の6月10日に、DiffusionGemmaと呼ばれる実験的なオープンソースモデルを正式にリリースしました。このモデルの大きな特徴は、テキスト拡散アーキテクチャ(テキストからテキストへの拡散)を採用していることで、新たなアプローチを通じて人工知能の生成効率を向上させることを目的としています。
パフォーマンステストでは、DiffusionGemmaは独自の技術的優位性を示しました。そのアーキテクチャ設計により、専用GPUでテキスト生成速度が従来の自己回帰型の大規模言語モデルに比べて最大4倍向上しています。しかし、グーグル公式は客観的な評価を維持しており、DiffusionGemmaが現在は研究者や開発者向けの実験的な製品であることを明確にしています。モデル出力の品質においては、標準的なGemma4に及ばないため、現段階では本番環境での使用は標準バージョンを使用することを推奨しています。
応用シーンにおいて、このモデルの速度の恩恵には明確な限界があります。その性能向上は主にローカルデバイスでの動作や低并发の推論シナリオに集中しています。一方で、高并发のクラウド配備要件に対応する場合、このアーキテクチャによる速度の利点は相対的に限定的です。
