アリババが最近発表した音声駆動型の肖像ビデオ生成フレームワークEMOは、入力音声に基づいて任意の長さのビデオを生成できます。このフレームワークはアリババのインテリジェントコンピューティング研究所のチームによって開発され、表現力豊かなビデオ生成技術です。EMOは従来のAIビデオ生成手法と比べて大幅な改善が見られますが、処理時間がかかるという欠点もあります。チームメンバーには薄列峰氏などが含まれ、論文でEMOの技術ルートと特性について詳しく説明しています。この新技術はAI分野に新たなブレークスルーをもたらし、人々の未来への期待を高めています。
アリババ、音声駆動型AIビデオジェネレーターEMOを発表
