Hugging Faceが発表したaMUSEdモデルは、数秒で画像を生成できる軽量なテキストツーイメージモデルです。Masked Image Model(MIM)アーキテクチャを採用することで、推論ステップを大幅に削減し、生成速度と解釈可能性を向上させています。
aMUSEdモデルは、Hugging Faceのデモで試すことができます。現在、研究プレビュー版として提供されており、OpenRAILライセンスを使用しています。拡散モデル以外のフレームワークを用いた画像生成に関するコミュニティによる更なる探求を奨励しています。