腾讯は最近、新たなマルチモーダルカスタムビデオ生成フレームワークであるHunyuanCustomを正式にオープンソースとして公開しました。これにより、AIビデオクリエイションがより高い自由度と精密な制御の新しいステージへと進展しています。このフレームワークは、腾讯が独自開発したHunyuanVideoに基づいており、「主体の一貫性」と「マルチモーダルの柔軟な入力」を特長として、ビデオコンテンツと入力素材が高度に一致する個別化された生成を目指しています。

HunyuanCustomの最大の強みはその強力なマルチモーダル入力能力です。ユーザーはテキストの説明や単一画像、複数画像、参考となる音声、さらには既存のビデオクリップなどを入力として使用でき、システムはこれらの情報を総合してカスタマイズされたビデオを生成します。この交差モーダルセンス能力により、コンテンツクリエイターは表現の柔軟性と力強さを得られます。

QQ20250512-094435.png

ビデオコンテンツの正確性において、HunyuanCustomは特にビデオ内の人物や物体のアイデンティティの一貫性に重点を置いています。従来のAIビデオで見られる「顔の変形」や「イメージの漂い」などの問題を効果的に解決し、生成結果をよりリアル、統一的、信頼できるものにしました。

QQ20250512-094446.png

このフレームワークの可能性は、以下のようなさまざまな業界シナリオで段階的に現れつつあります:

  • バーチャルキャラクターアドバタイジング: 特定のイメージを持つAIキャラクターを迅速に生成し、商業プロモーションに活用;

  • バーチャルフィッティング: ユーザーにオンラインで異なるコーディネートの効果を事前に確認させ、EC体験を向上;

  • カラオケアバター生成: 写真と音楽を融合して、楽しみながら表現力豊かなパーソナライズされたビデオを作成;

  • インテリジェントビデオエディット: 指定された人物やオブジェクトを自動的に置き換え、後工程の作業効率を向上させる。

腾讯は、HunyuanCustomのオープンソース化によって、マルチモーダルビデオクリエイションのハードルが大幅に低下すると述べています。これにより、開発者、コンテンツクリエイター、そして様々な業界のユーザーに高品質かつ一貫性のあるビデオ制作能力を提供し、AIビデオの実用範囲をさらに広げると予想されます。

URL: https://github.com/Tencent/HunyuanCustom