快手傘下にあるKling AIは、Omniエコシステム週の初日に2.6バージョンを発表しました。このバージョンでは初めて音声生成が内蔵され、中国語と英語の対話、歌い、効果音の同期出力が可能となり、「テキスト⇄動画⇄音声」を一括で閉じる機能を実現しました。公式キャッチコピー「See the Sound, Hear the Visual」は、多モーダル同期定位に直結しています。

技術仕様については、2.6バージョンは10秒の1080P高精細出力を維持しており、5秒ごとに25ポイントの積分が必要(前バージョンより30%低下)。拡散変換器+3D時空間連合注意機構により3つの向上がもたらされました:複雑な指示の遵守率が15%向上、シーン間のキャラクターの一貫性がSOTA(最良)に達し、Seedance 1.0の盲測テストにおいて勝率が285%を超えました。

市場面では、Kling 2.6はArtlistなどの専門プラットフォームで最初にリリースされる予定です。シーンの拡張と複数要素編集APIを提供し、映画、ショートドラマ、広告、MV制作を対象としています。快手は、2026年Q1に4K/60fpsバージョンをリリースし、カスタムボイスライブラリをオープンすることを明らかにしました。これにより、「AI制作」の障壁をさらに下げていきます。

業界の観察によると、音声同期によりAI動画の最後の欠点が補完され、後工程の編集プロセスは50%以上短縮される見込みです。Kling 2.6の導入により、AIクリエイティブツールの競争は「画像」から「音声」へと拡大し、音声付きショートビデオは新たな供給爆発を迎えることになります。