快手傘下、Kuaishou AI が本日「主体ライブラリ」(Subject Library)を正式にリリースしました。O1マルチモーダル動画モデルに「長期記憶」機能を追加しました。ユーザーはキャラクターの1枚の画像をアップロードするだけで、3Dビュー補完や複数の光線バリアントを生成し、シーンを跨いで「@キャラクターネーム」をワンクリックで呼び出すことが可能です。公式発表では「主体の一貫性>96%」であり、「AI顔変更」は完全に回避可能とされています。

単画像から3D記憶へ――主体ライブラリの3ステッププロセス
1. アップロード:JPG/PNG/RAWに対応し、自動的に背景除去、アライメント、色調統一を行います。
2. 補完:AIがサイドフェース、バック、部分的なディテールを生成し、3つのオプションから選べます。
3. 呼び出し:プロンプトに「@キャラクターネーム」と入力することで、任意のカメラアングル、照明、スタイルにおいて同一の顔と服のディテールを維持できます。

AIインテリジェントな説明――モデルがあなたのアイデアを理解する
- システムは「髪色+衣装+スタイル」を自動的に抽出し、60文字以内のキーワードを生成します。ユーザーは二次編集が可能です。
- 実験結果によると、スマートな説明を使用した場合、複雑なシーンでの一度の生成成功率が27%向上し、平均して12分の手動調整時間が節約されます。

O1モデルの統一インターフェース――テキスト・画像・動画のシームレスな連携
主体ライブラリとO1の「テキストから動画」「画像から動画」「最初と最後のフレーム制御」は同じ下層のlatent空間を使用し、次のように実現しています:
- 同じキャラクターが複数の動画で連続して登場し、IDのずれ<0.03
- 48fps/1080p出力に対応し、1本の動画最大で5分まで
- 公式統計によると、2024年にリリースしてからKling AIは30回以上アップデートされ、累計で2億本の動画が生成されました。
業界への衝撃――ショートビデオが「一貫性」の時代に入る
- 映画の予備視覚:プロダクション側は主体ライブラリを使って主役の造型を固定し、ストーリーボードを迅速に生成し、外景再撮影のコストを削減できます。
- 跨国販売:商家はモデルの画像を一度アップロードするだけで、多言語の試着動画を大量に生成でき、制作コストは1/10になります。
- バーチャルアイドル:IP側はVキャラクターをライブラリ内に保存し、ファンは「@キャラクター」と入力するだけで二次創作動画を生成でき、もう「顔変更」を心配する必要はありません。
オープン計画と価格
- 無料版:最大で5つの主体を保存でき、月に50回の呼び出し。
- Pro版:29元/月、主体数に制限なし、600回の呼び出し+5分の高精細生成付き。
- Enterprise API:呼び出し量に応じて課金、0.005元/回、プライベートな展開とブランドカスタマイズをサポート。
次のステップ:多人協働とリアルタイムのスタイル化
Kuaishou AIは、2025年Q1に「多人主体ライブラリ」と「リアルタイムスタイル化」をリリースする予定です。画面内で3人のキャラクターを同時に固定し、カートゥーン、レトロ、サイバーアニメなどの全体的なスタイルをリアルタイムで切り替えることができます。これにより、長編ドラマ、広告、ゲームアニメーションの製造ラインにさらに浸透します。
編集者の意見
