AI技術が急速に発展する中、Lightricks社は最近、最新のAI動画生成モデルであるLTX-2を発表しました。このモデルは、1回で20秒間の高解像度4Kのストーリー動画を生成でき、音声と口パクの同期も可能で、動画制作に革命をもたらしています。
LTX-2の核心技術は、音声と映像の同期生成能力です。従来のAI動画生成ツールは、無音の動画しか生成できず、後から手動でナレーションを追加する必要がありました。一方、LTX-2は、同じ拡散プロセスの中で映像と音声を同時に生成し、キャラクターの口元と音声、爆発の効果音と光、歩くリズムと足音が完全に同期します。この革新により、生成された動画はより現実的で一貫性があります。
さらに、LTX-2は最高で4K解像度と50fpsの出力に対応し、映像品質は映画レベルに達しています。連続性と安定性において、動画生成分野では新たな高みに到達しており、初めて安定してネイティブな4K動画を生成できるオープンソースAIモデルとなりました。これは、クリエイターが生成された動画を単なるAIアニメーションのスケッチではなく、映画、広告、プロモーションビデオなどに直接使用できるようになったことを意味しています。
このモデルは、テキスト、画像、スケッチなどのさまざまな入力方法をサポートしており、クリエイターがカメラの角度、物体の動作、時間のリズムなどを詳細に制御できます。この創作自由度の向上により、コンテンツクリエイターは自分のアイデアをよりよく表現できるようになります。また、組み込みのLoRA(Low-Rank Adaptation)微調整メカニズムにより、ユーザーは少量の素材で独自のスタイルモデルをトレーニングでき、動画が異なるシナリオで一貫性を持たせることができます。
LTX-2のもう一つの顕著な利点は、ローカルで動作できる点です。ユーザーはクラウドに接続する必要がなく、有料プラットフォームに縛られることもありません。このモデルは、コンsumer級GPUで動作し、2025年秋にオープンソースコード、モデルの重みおよびトレーニングプロセスを公開する予定で、クリエイター、開発者、研究者にさらなるコントロールとプライバシー保護を提供します。
Lightricks社は、今年後半にLTX-2のコードと性能ベンチマークをオープンソース化する予定で、AI動画生成技術の発展をさらに推進します。ユーザーは公式プラットフォームを通じてこの新しいモデルを体験できます。今後のAIクリエイティブ分野で、LTX-2が動画制作の「ゲームチェンジャー」となることを期待しています。
LTX-2の登場により、動画制作のハードルはさらに低下し、より多くのクリエイターがこの先進技術を活用して自分自身のアイデアや夢を実現できるようになります。
