シンガポール国立大学のLearning and Vision Labチームは最近、Video-Infinityという分散型長尺動画生成ツールを開発しました。このツールは複数のGPUを利用して高速に長尺動画を生成でき、既存モデルに追加のトレーニングを行う必要がなく、5分間で95秒の長さ(2300フレーム)の動画を作成できます。
ツールへのアクセス:https://top.aibase.com/tool/video-infinity
このツールは、分散処理、高速性、トレーニング不要といった特徴を備え、conda環境で簡単にインストールして使用できます。ユーザーは必要に応じて基本設定、パイプライン設定、Video-Infinity設定を行い、様々な動画生成ニーズに対応できます。
また、高周波情報の損失を防ぐために、ローカルコンテキストフレーム数とAttentionモデルのグローバルコンテキストフレーム数の合計を24以下に設定することを推奨します。これにより、動画の品質と安定性を維持できます。
比較実験の結果、この技術は動画フレーム数において顕著な優位性を持つだけでなく、時間コストにおいても優れた性能を示しました。開発チームによると、8台のNvidia Ada6000 GPUを用いてこの成果を実現し、サンプリングステップは30に設定されています。
研究チームは対抗実験も行い、Clip ParallelismとDual-scope Attentionの効果を消去分析しました。その結果、これらの2つの要素が動画生成に顕著な影響を与えることが示されました。さらに、この技術は複数のプロンプト(Multi-Prompts)に対応しており、背景、スタイル、テーマの滑らかな遷移を実現し、動画生成の可能性を広げます。
要点:
⭐️ この技術は5分以内に2300フレームの動画を生成でき、従来の方法より100倍高速です。
⭐️ Clip ParallelismとDual-scope Attentionは動画生成に顕著な影響を与えます。
⭐️ 複数のプロンプト(Multi-Prompts)に対応し、滑らかな遷移を実現します。