最近、清华大学 TSAIL ラボは生数科技と共同で、新しいオープンソースの動画生成高速化フレームワーク「TurboDiffusion」をリリースしました。この画期的な技術フレームワークは、動画生成の品質を損なうことなく、エンドツーエンドの拡散生成の推論速度を100〜200倍向上させることに成功しました。

image.png

AIbase によると、このフレームワークは極限の生成効率を実現するために、SageAttention および SLA(スパース線形アテンションメカニズム)を統合しています。これらの技術により、高解像度の動画コンテンツを処理する際の計算コストが大幅に削減されました。さらに、開発チームは rCM(時間ステップ蒸留)技術を導入し、拡散プロセスにおけるサンプリングステップ数を大幅に減少させることで、視覚的一貫性を保ちながら非常に低い計算遅延を実現しました。

GitHub が公表した実測データによると、TurboDiffusion の加速性能は驚くべきものがあります。RTX5090の1枚のグラフィックカード上で、従来では5秒分の動画生成に184秒かかっていたものが、このフレームワークを使用するとわずか1.9秒で完了します。パラメータ量が多いモデルでは、その向上はさらに顕著です。720Pの動画生成タスクが従来では約1.2時間かかっていたものが、今ではわずか38秒に短縮され、現在市販されている同様の高速化ソリューションよりもはるかに優れた性能を示しています。

image.png

現在、TurboDiffusion はオープンソースであり、ユーザーがダウンロードできるさまざまな仕様のモデル重みが提供されています。コンシューマー向けGPU(例えば RTX4090/5090)と産業向けGPU(例えば H100)に対して、それぞれ量化版と非量化版の最適化方案が用意されています。これは、個人クリエイターであっても企業ユーザーであっても、このツールを通じてAI動画の生産効率を著しく向上させることができるということを意味しています。

github:https://github.com/thu-ml/TurboDiffusion

ポイント:

  • 性能飛躍:清华オープンソースフレームワークはAI動画生成を最大200倍速くし、RTX5090で5秒の動画を1.9秒で生成できます。

  • 🛠️ 技術の核心: SageAttention、スパース線形アテンションメカニズム、および時間ステップ蒸留技術によって、画質を損なわずに計算力の需要を大幅に削減しています。

  • 🌐 完全対応: フレームワークはモデル重みを公開しており、異なるVRAM容量のGPUに対して最適化された量子化オプションを提供しており、高性能なAI動画生成の門檻を大きく下げています。