12月2日、Qwenアプリはワンシアンシリーズの最新モデルWan2.5に接続し、動画制作機能がさらに向上しました。動作精度と体の協調性が全面的に向上し、初めてモバイル端末用AIアシスタントとして音声と映像を同時に出力できるようになりました。

アリワンシアン2.5は、現在業界で音声と映像を同期させることができる動画モデルのうち少数の一つであり、このモデルは理解と生成などのさまざまなタスクをサポートしています。テキスト、画像、動画、音声など複数のモードの入力と出力をサポートしており、権威ある大規模モデル評価LMArenaにおいて、ワンシアンの画像から動画を作成する能力は世界第3位で、国内では常に第1位を維持しています。

Qwenアプリでは、ユーザーは1枚の写真と文章だけで、テンプレートなしで、自然な身体の動きや口の形が正確に一致した1080Pの高解像度の歌とダンスの動画を生成できます。最大で10秒までサポートされます。テスト結果によると、人間の写真、かわいいペット、アニメキャラクター、文物、カラーキャラクターなど、Qwenアプリはすべて対応可能です。

image.png

昨年の年初めにアリは写真で踊る機能を発表し、国内外で急速に人気になりました。ネットユーザーの創作熱を刺激し、兵馬俑、かわいい子ども、かわいいペットが踊る動画が全ネットで広まりました。今回はQwenアプリがワンシアン2.5に接続したことで、動画制作効果が大幅に向上し、動画制作の障壁もさらに低下しました。ユーザーは自分自身で写真をアップロードし、文章を入力することが可能になります。例えば、ユーザーは画像1枚と「猫が歌いながら踊る」という文章を入力するだけで、Qwenアプリは正確に動画を生成し、静止画のイメージを一瞬で「生きている」ようにします。

この機能が登場してから、再びネットユーザーの創作熱が沸き起こり、SNS上でより創造的な「写真で歌とダンス」のコンテンツが次々と登場しました。例えば、ユーザーはまずQwenアプリを使って2枚の画像を融合させ、中世の絵画スタイルのコラボ写真を生成し、その後「図中の人物が歌いながら踊り、カメラの画面には動的な感覚がある」といった文章を入力することで、合唱や群舞の動画効果を実現でき、高品質な動的な表現と非常に強い主体的一貫性を保つことができます。