阿里的EMO框架通過關注音頻提示和麪部動作之間的聯繫,增強了頭部視頻生成的真實度、自然度和表現力。EMO支持不同語言的歌曲和口語音頻生成,可以讓角色化身具有豐富的表情和動態。此外,EMO還能實現不同角色之間的聯動,爲視頻生成帶來更多可能性。
相關推薦
騰訊混元開源視頻生成加速方案,11. 8 倍提速,被CVPR2026 收錄
騰訊混元團隊開源視頻生成加速方案DisCa,通過可學習特徵緩存技術,在已蒸餾的少步模型上進一步壓縮推理成本,提升生成速度。該方案代碼與模型權重已公開,並被CVPR2026收錄。
Apr 16, 2026
253.9k
阿里ATH事業羣HappyHorse模型登頂AI視頻榜,Elo積分力壓Seedance2.0
國產多模態模型“HappyHorse-1.0”在文本轉視頻評測中以1332分登頂,領先字節跳動模型近60分。其海外社交賬號首位關注者爲阿里巴巴,暗示其研發背景。
Apr 10, 2026
213.5k
千問 3.6 正式發佈:100 萬長上下文,硬剛 Claude Code
阿里發佈新一代大語言模型Qwen3.6-Plus,被譽爲當前最強國產編程模型。相比3.5版本性能顯著提升,在多項編程評測中位居國產首位,整體能力接近國際標杆Claude系列。該模型在前端開發、複雜倉庫任務等方面展現出高度自主化能力。
Apr 3, 2026
693.4k
告別AI標準臉!阿里Wan2.7-Image發佈:能寫A4紙論文,還能像素級“捏臉”
阿里發佈Wan2.7-Image模型,突破傳統AI生圖侷限,告別“標準臉”實現“千人千面”。模型強化虛擬角色捏臉功能,支持從骨相、眼眸到五官細節的全方位定製,精準控制臉型、眼型等特徵,提升視覺效果與個性化體驗。
Apr 1, 2026
245.4k
谷歌發佈最親民視頻模型:Veo 3.1 Lite 開啓“分分錢”生成時代
谷歌推出輕量化視頻生成模型Veo3.1Lite,通過架構優化大幅降低算力成本,旨在推動高質量視頻生成普及。該模型對標市場輕量化產品,以高性價比和低至每秒0.05美元的720P視頻生成成本,滿足不同開發者需求。
Apr 1, 2026
179.9k
