人工知能動画分野で新たな波紋が広がっている。最近、バイトダンは一部のユーザーに対して静かに新世代のマルチモーダル動画生成モデル「Seedance2.0」を内側でテストしている。このモデルは業界関係者から「地球上で最も強力な」と評されているもので、深く統合された「オリジナル音声・映像生成能力」と「演出レベルの制御精度」により、コンテンツ制作の業界構造を急速に変えている。

マルチモーダルの統合と「参考」機能の突破
Seedance2.0の最大の技術的特徴は、画像、動画、音声およびテキストという4つの入力処理能力である。ユーザーは最大で12ファイル(9枚の画像、3本の動画、3つの音声を含む)を組み合わせて創作を行うことができる。
動作学習: このモデルはアップロードされた参照動画からカット言語、運動軌跡、エフェクトを学び、既存のシーンをスムーズに拡張したり、キャラクターを置き換えたりすることができる。
オリジナルサウンド: 前回のバージョンとは異なり、2.0バージョンでは4〜15秒の動画を生成する際に、高精度に同期したサウンド効果や音楽、さらには口元の動きを自動的にマッチングし、後工程の煩雑さを大幅に減らす。
実際の測定結果:驚きと議論が共存
有名なテクノロジーブロガー「映画颪風」のTimは、その性能を「恐ろしい」という表現を6回連続して使った。このモデルは、音声が提供されていない状態でも、写真をもとに本人の声質や画像に表示されていない会社ビルの裏面の詳細を正確にシミュレーションできるという。このような強力な「クローン」能力は、『黒神話:悟空』の開発者である冯骥氏などの業界の重鎮たちによって、「信頼危機」や著作権問題に関する深い懸念を引き起こした。現在、バイトは一部の敏感なリアルな人間の参照機能を緊急停止している。
業界の競争:中国のAI動画「二雄対決」
一方で、快手も最近「Kling3.0」をリリースした。Seedance2.0が複雑なマルチモーダルな参照やカメラワークの制御に重点を置いているのに対し、Kling3.0は物理的なフィードバック、多言語での口パク、キャラクターの一貫性において優れた性能を発揮している。
両社の対立は直接的に2次市場の熱狂を引き起こした。南華早報およびA株市場のデータによると、これらの「奇点級」モデルのリリースの影響を受け、国内の多くのメディアおよびAI関連銘柄の株価は一時的に最大で「20%」上昇し、資本市場ではAI動画がショートドラマ、アニメ、EC分野における商業化の見通しが非常に明るいとされている。
