OpenAI最近公佈了一項名爲sCM(簡化型、穩定型和可擴展型一致性模型)的突破性技術,這一創新徹底改變了AI圖像模型的訓練方式。該技術在原有的一致性模型(CMs)基礎上實現了重大突破,爲快速圖像生成開闢了新天地。

技術核心優勢:

只需兩步計算即可生成高質量圖像

在A100GPU上生成一張圖片僅需0.11秒

相比傳統擴散模型,速度提升50倍

最大模型參數達15億,創下新紀錄

image.png

在實際測試中,sCM的表現令人矚目。在CIFAR-10數據集上獲得了2.06的FID評分,在ImageNet上生成512x512像素圖像時達到了1.88的優異成績。這些指標僅比現有最佳擴散模型落後約10%,但速度卻有質的飛躍。

技術革新的關鍵在於解決了傳統一致性模型的根本性問題。此前的模型使用離散時間步長,不僅需要額外參數,還容易出錯。OpenAI的研究團隊通過建立簡化的理論框架,統一了各種方法,成功識別並解決了訓練不穩定的主要原因。

更令人期待的是,這項技術展現出強大的擴展潛力。OpenAI成功在ImageNet數據集上訓練了參數量達15億的模型,這在同類模型中尚屬首次。研究發現,隨着模型規模增大,圖像質量持續提升,這意味着未來可能實現更大規模的模型訓練。