AMD 在 AI 領域的進展值得關注,尤其是其最新發佈的針對 Stable Diffusion 模型的優化。近日,Stability AI 推出了基於 ONNX 框架優化的 Stable Diffusion 版本,這意味着 AMD 的 Radeon 顯卡和銳龍集顯在運行 AI 任務時性能提升顯著,最高可達3.8倍。這一進展不僅縮小了與 NVIDIA 在生態系統優化方面的差距,也爲 AMD 用戶帶來了實實在在的好處。
過去一年,AMD 與多個合作伙伴,包括操作系統供應商(OSV)、原始設備製造商(OEM)和獨立軟件開發商(ISV),在硬件設計、驅動程序、編譯器和機器學習模型等方面緊密合作,致力於提高 AMD 硬件的 AI 應用性能。根據 AMD 的官方數據,經過一系列優化後,SDXL1.0和 SDXL Turbo 在 AMD 硬件上的推理性能較基礎的 PyTorch 模型提升了3.8倍,而 SD3.5的性能提升則達到2.6倍。
在實際應用中,運行 SDXL1.0、SDXL Turbo、SD3.5Large 和 SD3.5Large Turbo 模型的 RX9070XT 顯卡,其效率分別提升了3.1倍、1.5倍、3.3倍和2.1倍。與此同時,銳龍 AI MAX+395顯卡在 SDXL1.0、SD3.5Large 和 SD3.5Large Turbo 的性能提升幅度分別爲1.4倍、3.3倍和3.0倍。這樣的性能改進讓 AMD 顯卡在圖像和視頻生成應用中表現更爲出色。
此外,AMD 特別標註了優化版 Stable Diffusion 模型,使用 “_amdgpu” 後綴(例如:stable-diffusion-3.5-large_amdgpu),用戶可以在 Stability AI 或 Hugging Face 平臺上下載這一優化版本。同時,AMD 和 TensorStack AI 聯合開發的 Amuse3.0版本也已上線,用戶體驗將更加流暢。值得注意的是,爲了順利使用這些優化模型,AMD GPU 驅動版本需不低於24.30.31.05的預覽版,或等待即將發佈的25.4.1正式版。
這一系列進展不僅提升了 AMD 顯卡的 AI 應用能力,還爲使用 AMD 硬件的開發者和用戶帶來了更多選擇和靈活性。