記事本文

アリババ、音声駆動型AIビデオジェネレーターEMOを発表

公開AI二ュ-ス

時間 :Feb 29, 2024

読む :1分

アリババが最近発表した音声駆動型の肖像ビデオ生成フレームワークEMOは、入力音声に基づいて任意の長さのビデオを生成できます。このフレームワークはアリババのインテリジェントコンピューティング研究所のチームによって開発され、表現力豊かなビデオ生成技術です。EMOは従来のAIビデオ生成手法と比べて大幅な改善が見られますが、処理時間がかかるという欠点もあります。チームメンバーには薄列峰氏などが含まれ、論文でEMOの技術ルートと特性について詳しく説明しています。この新技術はAI分野に新たなブレークスルーをもたらし、人々の未来への期待を高めています。

航空券の購入は一言で！東方航空とアリババの千問が提携し、国内初のコンシューマー向けAI飛行時代を切り開く

東航はアリババのAI「千問」と提携し、中国初の消費向けAIを導入した航空会社に。旅客は一言でチケット検索・予約が可能で、補助金も適用。従来の検索から対話型サービスへ進化し、購入プロセスを大幅に簡素化。今後は「航空券+」や生活サービス分野での連携を深化予定。....

Feb 11, 2026

151.7k

アリババ新世代オープンソースモデル Qwen3.5の詳細が公開：春节に原生 VLM をサポートしてリリースされる可能性

アリババが新たに開発した基盤モデル Qwen3.5 が近日リリース予定で、HuggingFaceにコードマージ申請を提出しています。このモデルは新しいミックスドアテンションメカニズムを採用しており、視覚理解をネイティブにサポートする可能性があります。少なくとも2Bの密集型モデルと35B-A3BのMoEモデルがオープンソース化される見込みで、春節に正式なオープンソースリリースが期待されています。

Feb 9, 2026

314.7k