浙大與阿里聯合發佈OmniAvatar:音頻驅動全身數字人模型震撼登場

AIbase基地

發布於AI新聞資訊 · 1 分鐘閱讀 · Jul 8, 2025

浙江大學與阿里巴巴聯合推出全新音頻驅動模型OmniAvatar，標誌着數字人技術邁向新高度。該模型以音頻爲驅動，可生成自然流暢的全身數字人視頻，尤其在歌唱場景下表現突出，口型與音頻脣形同步精準，效果逼真。

OmniAvatar支持通過文本提示精細控制生成細節，用戶可自定義人物動作幅度、背景環境及情緒表達，展現出極高的靈活性。此外，該模型能夠生成虛擬人物與物體互動的視頻，爲電商廣告、營銷廣告等商業場景提供了廣闊應用空間。例如，品牌可利用OmniAvatar製作動態廣告，增強消費者互動體驗。

作爲開源項目，OmniAvatar已在GitHub上發佈，吸引了全球開發者的關注。其在面部表情、半身及全身動畫生成上的優異表現，超越了現有同類模型。據悉，該模型還支持多場景應用，包括播客節目、人際互動及動態表演等，展現了其在內容創作領域的巨大潛力。

業界專家表示，OmniAvatar的發佈不僅提升了音頻驅動數字人技術的真實性與可控性，也推動了AI在營銷、教育及娛樂等領域的創新應用。未來，浙江大學與阿里巴巴將繼續深化合作，探索多模態AI的更多可能性。

微信AI搜索被指"強行開盒"姓名秒變超鏈接騰訊迴應:僅整合公開信息

微信新推出的AI搜索功能因涉嫌泄露個人隱私引發廣泛關注。近日，多名網友在社交平臺反映，該功能可通過姓名超鏈接一鍵生成個人簡歷，引發用戶對隱私安全的擔憂。據用戶反饋，微信AI搜索的爭議主要集中在其自動識別機制上。當用戶在微信公衆號推文中遇到人名時，系統會自動將姓名轉換爲藍色超鏈接。點擊該鏈接後，AI系統會強制生成一份包含個人簡歷在內的詳細信息頁面，同時展示所有涉及該姓名的相關推文內容。多名體驗過該功能的網友證實，"確實可以根據名字查到很多個人

Jul 2, 2025

46.2k

京東具身智能戰略全面提速 JoyInside合作版圖曝光

據網易科技報道，京東在具身智能領域的佈局正在全面提速。京東旗下具身智能品牌JoyInside已與十餘家頭部機器人企業達成合作，成爲京東搶佔智能機器人市場的核心引擎。據知情人士透露，JoyInside由京東大模型技術支持，專注於提供機器人與消費者的智能互動能力，其產品策略聚焦於"一人一狗一玩具"的場景化應用。該品牌自推出以來，已成功吸引了多個細分領域的頭部企業加入合作陣營。在家庭陪伴場景中，魔法原子MagicDog Pro四足機器狗、念NIA-F01人形機器人、"璇璣"蛋形機器人等產品

Jul 2, 2025

46.2k

富士康推出首款AI推理大模型 “FoxBrain”，商標申請已提交

近日，鴻海精密工業股份有限公司（也就是大家熟悉的富士康）在國家知識產權局商標局提交了 “FoxBrain” 商標註冊申請。這款 AI 推理大模型不僅是富士康的首次嘗試，更是臺灣地區首個該類型的 AI 模型。根據公開資料顯示，該商標的國際分類爲科學儀器，目前正處於 “等待實質審查” 的狀態。“FoxBrain” 是鴻海研究院重磅推出的 AI 推理大模型，涵蓋數據分析、數學推理、代碼生成等多個功能，功能豐富，極具潛力。富士康聲稱，FoxBrain 的初始版本基於 Meta 的 Llama3.1模型進行開發，使

Jul 2, 2025

46.2k

智譜AI重磅開源GLM-4.1V-Thinking！多模態推理新王者，挑戰全球頂尖模型

中國人工智能領域的領軍企業智譜AI（Zhipu AI）再次掀起行業熱潮。AIbase最新獲悉，智譜AI於近日正式開源其新一代通用視覺模型GLM-4.1V-Thinking。這款9億參數的多模態推理模型憑藉卓越的性能和廣泛的應用場景，不僅在多項權威評測中刷新紀錄，還展現了比肩甚至超越72億參數模型的強大實力。以下是AIbase整理的最新資訊，帶您深入瞭解這一突破性技術。引入思維鏈推理，性能大幅提升GLM-4.1V-Thinking基於智譜AI此前的GLM-4V架構進行了深度優化，引入了創新的思維鏈推理機制（Chain-of-Thought Reason

Jul 2, 2025

46.6k

智譜AI開源GLM-4.1V-Thinking:多模態推理模型再突破

智譜AI正式開源最新一代通用視覺模型GLM-4.1V-Thinking，基於GLM-4V架構，新增思維鏈推理機制，顯著提升複雜認知任務能力。該模型支持圖像、視頻、文檔等多模態輸入，擅長長視頻理解、圖像問答、學科解題、文字識別、文檔解讀、Grounding、GUI Agent及代碼生成等多樣化場景，覆蓋千行百業的應用需求。GLM-4.1V-9B-Thinking在28項權威評測中表現卓越，其中23項達成10B級模型最佳成績，18項持平或超越72B參數的Qwen-2.5-VL，涵蓋MMStar、MMMU-Pro、ChartQAPro、OSWorld等基準測試。其9億參數規模結合高效推理能力

Jul 2, 2025

46.2k

亞馬遜 Alexa + 助手用戶突破百萬，智能語音體驗再升級

近日，亞馬遜的升級版 AI 助手 Alexa + 在用戶數量上取得了重要里程碑。根據 Techcrunch 的報道，自2025年2月首次推出以來，Alexa + 的用戶人數在短短几個月內迅速增長，截至今年6月底，註冊用戶已突破100萬大關。這一數字的出現，標誌着亞馬遜在 AI 助手領域的進一步成功。圖源備註：圖片由AI生成，圖片授權服務商Midjourney在 Alexa + 的早期試用階段，用戶能夠免費使用這款助手。未來，亞馬遜計劃將其提供給 Prime 會員免費，而非 Prime 會員在公開發布後需支付每月19.99美元的使用費。值得注意

Jul 2, 2025

46.2k

浙大與阿里聯合發佈OmniAvatar:音頻驅動全身數字人模型震撼登場

相關AI新聞推薦

微信AI搜索被指"強行開盒"姓名秒變超鏈接 騰訊迴應:僅整合公開信息

京東具身智能戰略全面提速 JoyInside合作版圖曝光

富士康推出首款AI推理大模型 “FoxBrain”，商標申請已提交

智譜AI重磅開源GLM-4.1V-Thinking！多模態推理新王者，挑戰全球頂尖模型

智譜AI開源GLM-4.1V-Thinking:多模態推理模型再突破

亞馬遜 Alexa + 助手用戶突破百萬，智能語音體驗再升級

微信AI搜索被指"強行開盒"姓名秒變超鏈接騰訊迴應:僅整合公開信息