Lightricks は、AI動画生成モデル LTX-Video (LTXV) の重大なアップデートを発表しました。この更新により、最大で60秒の画像から動画を作成できるようになりました。これは業界の従来の8秒制限を打ち破り、LTXV を初めてリアルタイムで長編AI動画を生成できるオープンソースモデルにしました。

image.png

60秒動画生成:短編から長編物語への飛躍

LTXV の最新バージョンは、自己回帰型ストリーミングアーキテクチャを導入し、単一の画像から最大60秒の高品質な動画を生成できるようになりました。従来モデルの短時間出力とは異なり、LTXV は生成中にリアルタイムで動画をストリーミングでき、最初の1秒の内容はほぼ瞬時に表示され、その後シーンが継続的に構築されます。この技術により、より長い動画生成が可能になり、動きと物語が滑らかで連続的になります。これにより、クリエイターにとってこれまでにない物語表現の空間が提供されます。

ユーザーは詳細なテキストプロンプトに加え、初期画像を入力することで、解像度が768x51224FPS

リアルタイム制御と創作の柔軟性

LTXV モデルの更新により、動的なシーン制御機能が導入されました。これにより、動画生成中にポーズ、深度、スタイルなどの要素をリアルタイムで調整することが可能です。Lightricks の IC-LoRA技術を活用して、クリエイターはポーズ検出やエッジ検出などの制御信号を継続的に適用し、動画の細部を正確にコントロールできます。この「生成しながら演出する」能力により、LTXV は単なるプロンプト生成ツールから本格的な長編物語プラットフォームへと進化しました。

また、LTXV は複数の生成モードをサポートしており、テキストから動画画像から動画キーフレームアニメーション、および動画拡張などがあります。ユーザーは複数の画像や短い動画セグメントを条件として組み合わせて、複雑な動画コンテンツを生成することも可能です。このような柔軟性により、SNSの短編動画からインタラクティブな教育コンテンツ、さらにはリアルタイムのARビジュアル効果まで幅広いシーンに対応できます。

効率性とオープンソース:幅広いクリエイターを支援

LTXV のもう一つの特徴はその効率性とハードウェアとの親和性です。130億パラメータbfloat16精度4秒以内

オープンソースモデルとして、LTXV のコードと重みはGitHubHugging Face

業界への影響と今後の展望

Lightricks の今回のアップデートにより、AI動画生成は新たな高みへと進みました。60秒の動画生成能力の突破は、個人クリエイター、マーケティングチーム、ゲーム開発者に対して長編コンテンツを迅速に生成できる力を与え、リアルタイムでのインタラクティブなアプリケーション(例:動的なARビジュアルやプレイヤー主導のゲームムービー)の基盤にもなります。

SNSからのフィードバックによると、ユーザーはLTXVのスピードと品質に感嘆しています。例えば、RTX4080で768x512の動画を生成するのにわずか45秒

ただし、LTXV は非商業用途に限定されているため(学術研究・研究目的のみ)、一部の商業クリエイターにとっては課題となる可能性があります。Lightricks は、その旗艦プラットフォームであるLTX Studio

AIbase は、LTXV のアップデートがAI動画制作の可能性を再定義したと評価しています。そのオープンソース戦略と効率的な性能は、業界の革新を加速させるでしょう。今後、モデルがさらに最適化されることで、LTXV はプロフェッショナルな映画制作やリアルタイムのコンテンツ生成分野で重要な地位を占めることが期待されます。