AMDのAI分野における進歩は注目に値し、特にStable Diffusionモデルに対する最新の最適化は大きな成果です。最近、Stability AIはONNXフレームワークに基づいたStable Diffusionの最適化バージョンをリリースしました。これにより、AMDのRadeonグラフィックカードとRyzen統合グラフィックではAIタスクの実行性能が大幅に向上し、最大3.8倍の高速化を実現しました。この進歩は、NVIDIAとのエコシステム最適化における差を縮めるだけでなく、AMDユーザーにとって実質的なメリットをもたらします。

過去1年間、AMDはOSベンダー(OSV)、OEM、ISVなど複数のパートナーと緊密に協力し、ハードウェア設計、ドライバー、コンパイラ、機械学習モデルなどにおいて、AMDハードウェアのAIアプリケーション性能向上に取り組んできました。AMDの公式データによると、一連の最適化の後、SDXL1.0とSDXL Turboは、基本的なPyTorchモデルと比較してAMDハードウェア上での推論性能が3.8倍向上し、SD3.5の性能向上は2.6倍に達しました。

image.png

実際のアプリケーションでは、SDXL1.0、SDXL Turbo、SD3.5Large、SD3.5Large Turboモデルを実行するRX 9070 XTグラフィックカードの効率は、それぞれ3.1倍、1.5倍、3.3倍、2.1倍向上しました。同時に、Ryzen AI MAX+ 395グラフィックカードでは、SDXL1.0、SD3.5Large、SD3.5Large Turboの性能がそれぞれ1.4倍、3.3倍、3.0倍向上しました。このような性能向上により、AMDグラフィックカードは画像および動画生成アプリケーションでより優れたパフォーマンスを発揮します。

さらに、AMDは最適化版Stable Diffusionモデルに「_amdgpu」サフィックス(例:stable-diffusion-3.5-large_amdgpu)を付けることを特別に指定しています。ユーザーはStability AIまたはHugging Faceプラットフォームからこの最適化バージョンをダウンロードできます。同時に、AMDとTensorStack AIが共同開発したAmuse 3.0バージョンもリリースされており、ユーザーエクスペリエンスがさらにスムーズになります。これらの最適化モデルをスムーズに使用するためには、AMD GPUドライバーのバージョンが24.30.31.05プレビュー版以上であるか、近日リリースされる25.4.1正式版を待つ必要があります。

これらの進歩は、AMDグラフィックカードのAIアプリケーション能力を向上させるだけでなく、AMDハードウェアを使用する開発者とユーザーにより多くの選択肢と柔軟性をもたらします。