Runwayが、カメラの動きを精密に制御できる全く新しいカスタムカメラコントロールパネルを発表しました。このレンズ制御機能は、画像生成ビデオ、テキスト生成ビデオ、そしてテキストと画像の組み合わせによるビデオ生成にも適用可能です。PikaとGen2は激しい競争を繰り広げており、Pikaは意味理解において優れている一方、Gen2はより多くの制御可能性を備えています。Runwayはレンズ制御の強化を継続しており、Pikalabsはどのように対応していくのかが課題となっています。AIによるビデオ生成技術は新たな時代に入り、RunwayとPikalabsが業界をリードする企業となっています。
関連推奨
13億ドルに急騰!元Snapの幹部が設立したAI動画会社Higgsfieldが大規模な資金調達を実施
AI動画生成スタートアップHiggsfieldがシリーズA拡張ラウンドで総調達額1億3000万ドル、評価額13億ドルを達成しユニコーン企業となった。Snap AI元責任者が創業し、消費者・クリエイター・マーケティングチーム向けAI動画制作ツールを提供。....
オープンソース版Veo 3が登場:LTX-2が正式リリース。1回で20秒分の4K音声同期AI動画を生成。ローカルGPUでスムーズに動作
LightricksがLTX-2モデルをオープンソース化。20秒の4K高画質動画生成を可能にし、映像・音声・口元・環境音・音楽の完全同期を実現。モデル・学習コード・評価基準・ツールキットをGitHubで公開し、コミュニティから高い関心を集めている。....
数秒で1分間の連続した物語ビデオを生成!バイツーがオープンソースのStoryMemをリリースし、AIビデオのキャラクター顔が常に変わらないようにしました
ByteDanceとNTUが開発したオープンソースフレームワーク「StoryMem」は、革新的な「視覚的記憶」メカニズムにより、単一ショット動画生成モデルをマルチショット長編動画生成ツールに進化させ、1分以上の自然なカット割りでキャラクターとシーンの一貫性を保つ物語動画を自動生成し、オープンソースAI動画技術の映画級ナラティブへの発展を促進します。....
清華がオープンソースのTurboDiffusion AI動画生成で速度が200倍に向上、エントリーレベルのGPUでも瞬時に映画のような映像を生成!
清华大学TSAILラボと生数科技が共同でオープンソースした動画生成高速化フレームワークのTurboDiffusionは、AI動画拡散モデルの推論速度を100〜200倍に向上させ、視覚的な品質はほぼ損なわれていません。この技術は現在のオープンソースモデルに対して深い最適化を施し、一枚のRTX 5090 GPUで分単位から秒単位までリアルタイムでの生成を実現し、AIによる動画創作の新時代を切り開きました。
硬いAI動画からさようなら!カーシューKling2.6であなたの声をAIキャラクターに蘇らせる。複雑なダンス動作も完璧に再現
カーシューKling 2.6バージョンは音声と動作の制御の2つの機能を導入し、ネイティブなオーディオ生成を実現し、複雑なアクション処理の精度を向上させました。音声制御により、ビデオに合ったサウンドエフェクト、人の声、音楽を生成でき、カスタマイズ可能なボイスカスタマイズが可能です。
