正文

阿里推出基於音頻驅動的AI視頻生成器EMO

發布於AI新閒資訊

時間 :Feb 29, 2024

閱讀 :1分鐘

阿里最新推出的基於音頻驅動的肖像視頻生成框架EMO，可以根據輸入音頻生成任意持續時間的視頻。該框架由阿里巴巴智能計算研究院團隊開發，是一種富有表現力的視頻生成技術。EMO與之前的AI視頻生成方法相比有較大提升，但也存在耗時較長的缺點。團隊成員包括薄列峯等人，他們在論文中詳細介紹了EMO的技術路線和特性。這一新技術爲AI領域帶來了新的突破，讓人們對未來的發展充滿期待。

阿里ATH事業羣HappyHorse模型登頂AI視頻榜，Elo積分力壓Seedance2.0

國產多模態模型“HappyHorse-1.0”在文本轉視頻評測中以1332分登頂，領先字節跳動模型近60分。其海外社交賬號首位關注者爲阿里巴巴，暗示其研發背景。

Apr 10, 2026

208.0k

千問 3.6 正式發佈：100 萬長上下文，硬剛 Claude Code

阿里發佈新一代大語言模型Qwen3.6-Plus，被譽爲當前最強國產編程模型。相比3.5版本性能顯著提升，在多項編程評測中位居國產首位，整體能力接近國際標杆Claude系列。該模型在前端開發、複雜倉庫任務等方面展現出高度自主化能力。

Apr 3, 2026

726.2k

告別AI標準臉!阿里Wan2.7-Image發佈:能寫A4紙論文，還能像素級“捏臉”

阿里發佈Wan2.7-Image模型，突破傳統AI生圖侷限，告別“標準臉”實現“千人千面”。模型強化虛擬角色捏臉功能，支持從骨相、眼眸到五官細節的全方位定製，精準控制臉型、眼型等特徵，提升視覺效果與個性化體驗。

Apr 1, 2026

239.9k

打車只需“一句話”！阿里千問上線 AI 辦事：本地生活流量迎來大洗牌

阿里旗下千問AI助手推出“AI打車”功能，用戶通過自然語言對話即可完成叫車和行程規劃。此舉不僅是技術升級，更是阿里以AI原生服務重塑本地生活流量入口的關鍵佈局，展現其向“全能助理”進化的戰略加速。

Mar 23, 2026

228.6k

阿里 CEO 吳泳銘親自掛帥！“悟空”事業部立項：AI 轉型下半場的生死突圍

阿里成立ATH事業羣，由CEO親自掛帥，整合通義實驗室、MaaS、千問、AI創新及悟空事業部，旨在應對AI行業“模型過剩、場景飢渴”現狀，從“卷參數”轉向“卷應用”，發力下半場競爭。

Mar 19, 2026

197.6k

智啟未來，您的人工智能解決方案智庫