国内トップクラスのビデオ生成モデルであるKling AI(可灵AI)は、本日3.0時代への正式な進出を発表しました。今回のアップデートは単なるパラメータの更新ではなく、動画と画像生成の能力について、下位ロジックから応用ツールに至るまで、全次元的なアップグレードです。新バージョンのコアは物語の表現力、画面の制御性、マルチモーダルの協調性を中心に据え、プロのクリエイターおよび一般ユーザーにさらにスムーズな「ネイティブ」な創作体験を提供することを目的としています。

image.png

動画生成の分野において、Kling 3.0は画期的な「スマートショット」機能を導入しました。これまでAIによる動画は単一のシーンに制限されていましたが、新バージョンでは劇本の要望を自動的に理解し、シーンの構図やカメラの位置を自律的に調整することができ、AIで生成された短編映画にはより強烈な映画感が生まれます。また、画像から動画を生成する能力も質的に向上し、ユーザーは複数の画像や動画の断片を主体として参照することで、キャラクターやシーンの特徴を正確に特定できます。さらに、動画の長さは3秒から15秒に拡張され、多言語の口唇同期技術と組み合わせることで、複雑なストーリーの長回し表現がより自然になります。

画像生成に関して、画像3.0シリーズモデルも驚きをもたらします。映画級の光と影の再構築技術を導入したことで、モデルは提示文に含まれる視覚的要素をより正確に解析し、ネイティブな2Kあるいは4Kの高解像度画質を出力できます。共同制作のニーズに対応するために、新バージョンは最大10枚の参考画像の融合をサポートしており、トーンの統一やスタイルの転換など、ユーザーは機能を頻繁に切り替えることなくワンクリックで完了できます。

現在、Kling AI 3.0の一部の新機能はブラックゴールド会員向けに先行体験が可能です。公式によると、今後の数か月間でさらなる機能が順次リリースされる予定であり、感覚から完成品に至るまでのすべての段階におけるAI制作プロセスをさらに完結させます。

ポイント:

  • 🎬 物語表現の再構築: スマートショットと15秒の長回しのサポートが追加され、AIがディレクターのようにカメラの位置や構図を自動的に調整し、プロレベルの動画制作のハードルを下げます。

  • 🧬 一貫性の深層的な進化: 複数の画像や動画の主となる参照をサポートし、人物や小物の特徴を正確に特定し、多言語の口唇同期を実現して、キャラクターの表現力を向上させます。

  • 🖼️ 画質とプロセスの向上: 画像モデルはネイティブな4K出力をサポートし、複数の画像のスタイルの融合にも対応し、マルチモーダル一体化の制作フローを初めて導入し、生成から編集に至るまですべてのプロセスをカバーしています。