アリババが最近発表した音声駆動型の肖像ビデオ生成フレームワークEMOは、入力音声に基づいて任意の長さのビデオを生成できます。このフレームワークはアリババのインテリジェントコンピューティング研究所のチームによって開発され、表現力豊かなビデオ生成技術です。EMOは従来のAIビデオ生成手法と比べて大幅な改善が見られますが、処理時間がかかるという欠点もあります。チームメンバーには薄列峰氏などが含まれ、論文でEMOの技術ルートと特性について詳しく説明しています。この新技術はAI分野に新たなブレークスルーをもたらし、人々の未来への期待を高めています。
関連推奨
アリババの匿名モデルHappyHorseが世界ランキングを制覇 ビデオ生成が高得点時代へ
アリババが秘密裏に開発したマルチモーダル大規模モデルHappyHorseが国際評価で首位に輝き、1332点を記録し、世界的なビデオ生成Elo記録を刷新。この結果、同社の株価は前場で約3%上昇しました。
Apr 10, 2026
268.0k
アリババのATH事業グループが開発したハッピーハースモデルがAI動画ランキングで首位に、EloスコアでSeedance2.0を上回る
国内のマルチモーダルモデル「HappyHorse-1.0」は、テキストから動画への評価において1332点を獲得し、ビーティーのモデルに約60ポイントの差をつけて首位に輝きました。その海外のSNSアカウントの最初のフォロワーはアリババであり、その開発背景を示唆しています。
Apr 10, 2026
176.2k
宇樹の新製品ロボットR1がアリババキャンパスに登場、スモールビジネスプロジェクトが表面化
4月9日、宇樹科技の人型ロボットR1が杭州のアリババキャンパスで披露され、両社の協力が始動。R1は人間のようにPCを操作し、画面に「招待状」を表示し、4月中旬に開始予定の「樹売通」プロジェクトを宣伝。....
Apr 9, 2026
166.7k
アリババのAIアーキテクチャの大規模な見直し!リー・フィーがアリババクラウドCTOに就任、トンイー研究所が大モデル事業部に昇格
アリババは組織構造の調整を発表し、中心はAI建設の加速である。CEOのユー・ヨンミン氏は社内メールを通じて、グループ技術委員会の設置と業務部門の強化を発表し、AIの全面的な加速期を開く。最も注目されているのは、世界的に著名な科学者リー・フィー氏の参画である。彼はアリババクラウドCTOに就任し、アリババクラウドの技術およびAIクラウドインフラストラクチャの全般的な責任を担うこととなる。
Apr 8, 2026
275.4k
AI標準顔からサヨナラ!アリババWan2.7-Image公開:A4用紙の論文を書け、ピクセル単位で顔を作れる
アリババがWan2.7-Imageモデルを発表。従来のAI画像生成の限界を突破し、「標準顔」から脱却して一人人一人異なる顔を実現。モデルは仮想キャラクターの顔編集機能を強化し、骨格、目元、顔の細部に至るまで全体的なカスタマイズをサポート。顔の形や目尻などの特徴を正確に制御し、視覚効果と個別体験を向上させる。
Apr 1, 2026
235.1k
