12月16日、アリババは新世代のワンシャン2.6シリーズモデルを発表しました。このモデルはプロフェッショナルな映画制作や画像創作のシナリオに全面的にアップグレードされ、**「世界で最も機能が充実した動画生成モデル」**と称され、ワンシャン2.6はすでに阿里雲百煉ワンシャン公式サイトに同時リリースされました。

ワンシャン2.6シリーズの最大の魅力は、国内で初めて「キャラクターのプレイ」機能をサポートする動画モデルであることです。また、音声と映像の同期、複数のカット生成および音声駆動などの機能もサポートしています。

 コアなアップグレードと技術的な突破

今回のアップグレードでは、画質、サウンド効果、指示の遵守などにおいてさらに向上し、一度の動画の長さは国内で最高の15秒まで延長されました。このモデルシリーズは、テキストから画像生成、画像編集、テキストから動画生成、画像から動画生成、人間の声から動画生成、動作生成、キャラクターのプレイ、および一般的な動画編集など、10種類以上の視覚的創造能力をサポートしています。

1. キャラクターのプレイ機能(国内初):

ワンシャン2.6は、入力された動画中のキャラクターの外見と声の特徴を参考に、提示語に基づいて単人、多人、人と物の協調性のある動画を生成します。モデル構造において、通義ワンシャンは複数の革新技術を統合しており、参照動画に対してマルチモーダルな連合モデリングと学習を行います。これにより、主体の感情、姿勢、視覚的特徴、声の特徴、話す速度などの音響的特徴を抽出し、すべての感覚と次元にわたる一貫性と移行を確保します。

2. プロフェッショナルなシーン制御:

モデルには新たにシーン制御機能が追加され、ユーザーの簡単な提示語を複数のシーンを持つ脚本に変換し、複数のカットを含む一貫した物語の動画を生成できます。上位の意味理解を通じて、ワンシャン2.6は、完全なストーリー線と叙事の張力を備えたプロフェッショナルな複数カットセクションを構築でき、カットのスムーズな切り替え中に、主要な要素、シチュエーションのレイアウト、環境の雰囲気の高い一貫性を維持します。

映画レベルの創作シナリオへの支援

ワンシャン2.6のキャラクターのプレイ機能とシーン制御機能は、プロの映画レベルのシナリオのニーズを大幅に満たしています。

例えば、一般ユーザーが個人の動画をアップロードし、SFミステリー風の提示語を入力すると、ワンシャン2.6は数分でシナリオ設計、キャラクターの演技、映像の声の合成などを完了し、カメラワークが映画レベルで、ストーリーが完結した短編映画を生成し、ユーザーが「映画の主役になる夢」を叶えるお手伝いをします。

広告デザインやショートドラマ制作などの専門的なシナリオにおいては、連続した提示語を入力することで、モデルは一貫した物語を持つ短編映画を生成し、誰もが監督になれるようにします。

 国内でのリードを継続

アリババは今年9月に国内で最初に音声と映像の同期をサポートする動画生成モデルワンシャン2.5を発表しました。権威ある大規模モデル評価データセット LMArena において、ワンシャンの画像から動画生成は国内第一位です。今回の2.6バージョンのリリースにより、同社は国内の動画生成分野におけるリード地位をさらに強化しました。

今すぐ、誰でもワンシャン公式サイトでワンシャン2.6を体験できます。企業ユーザーは阿里雲百煉からAPIを呼び出すことができます。また、Qwenアプリ