阿里最新推出的基於音頻驅動的肖像視頻生成框架EMO,可以根據輸入音頻生成任意持續時間的視頻。該框架由阿里巴巴智能計算研究院團隊開發,是一種富有表現力的視頻生成技術。EMO與之前的AI視頻生成方法相比有較大提升,但也存在耗時較長的缺點。團隊成員包括薄列峯等人,他們在論文中詳細介紹了EMO的技術路線和特性。這一新技術爲AI領域帶來了新的突破,讓人們對未來的發展充滿期待。
相關推薦
國產 AI 大模型集體“爆發”:技術登頂,資本熱捧
國產AI大模型迎來突破,智源研究院的“Emu3”模型登上《自然》期刊,實現中國大模型領域首次國際頂尖學術認可,標誌着底層架構創新取得重大進展。
Feb 4, 2026
182.6k
千問PC和網頁端上線國內最強推理模型,主動性更強、擅長邏輯推理
阿里發佈旗艦推理模型Qwen3-Max-Thinking,參數量超萬億,預訓練數據達36T Tokens。該模型通過強化學習訓練,在事實知識、數學推理等方面表現優異,已接入千問PC端和網頁端,App即將支持。用戶可一鍵切換體驗更強推理能力。
Jan 27, 2026
229.6k
千問全面接入阿里生態:點外賣、買機票一句話搞定,開啓“AI 辦事”時代
阿里千問App全面接入淘寶、支付寶等核心業務,上線超400項AI辦事功能,支持全球用戶通過一句話指令完成點外賣、購物等操作,實現AI交互新突破。
Jan 15, 2026
193.0k
阿里 Qoder 升級補全功能,AI 代碼採納率大幅提升65%
阿里Qoder升級爲Qoder NEXT,智能補全功能大幅提升。它能主動感知代碼庫和編輯歷史,分析上下文後精準推斷後續聯動變更,爲開發者提供高效智能的編程建議。
Jan 7, 2026
174.2k
阿里千問APP公測,與ChatGPT展開全面競爭
阿里巴巴11月17日推出“千問”APP公測版,基於開源模型Qwen3,免費結合生活場景生態,與ChatGPT競爭。管理層視其爲AI時代關鍵戰役,已上線應用商店及網頁、PC版,國際版即將發佈。
Nov 17, 2025
457.2k
