正文

阿里發佈肖像視頻生成框架 EMO

aibase

發布於AI新閒資訊

時間 :Feb 29, 2024

閱讀 :1分鐘

阿里巴巴團隊發佈了肖像視頻生成框架 EMO，能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻。EMO利用參考網絡從參考圖像和動作幀中提取特徵，通過預訓練的音頻編碼器處理聲音並嵌入，結合多幀噪聲和麪部區域掩碼生成視頻。實驗結果表明，EMO在表現力和真實感方面優於現有方法。該模型潛在應用方向將提高數字媒體和虛擬內容生成技術水平，但也可能被用作犯罪工具。

相關推薦

AI 行情帶動股市走強，瑞銀報告：2025 年全球新增近百萬美元富翁

瑞銀最新財富報告顯示，受AI熱潮帶動股市上揚，全球財富增速創近年新高，個人財富整體上漲10.8%，但頂層富豪獲益更豐，億萬富豪資產平均激增25%。全球億萬富翁數量同比增13%至3302人，500億至千億美元身家者18人，超千億美元19人，絕大多數頂級富豪定居美國。

Meta 低調殺入 AI 原生社交，掌上應用 Pocket 開啓趣味互動新玩法

Meta推出AI社交應用Pocket，用戶輸入文字提示即可生成並分享互動遊戲“gizmo”，零編程門檻讓普通人化身創作者，與好友共同探索、親密互動。

亞馬遜加碼印度：擬投 130 億美元佈局AI與雲基礎設施

亞馬遜宣佈2030年前在印度追加130億美元投資，重點擴展AWS孟買與海得拉巴數據中心，強化AI及雲服務能力。

市場風向生變：SpaceX股價回調，OpenAI IPO推遲至明年

受市場波動加劇與高估值科技股重新定價壓力影響，OpenAI已將原定今年第三、四季度的IPO計劃推遲至明年。CEO薩姆·奧爾特曼此前曾力推1萬億美元估值目標，但震盪的市場環境迫使公司調整上市節奏。

智慧醫療新風向：中國聯通與魚躍醫療聯手，爲健康設備裝上“AI大腦”

聯通與魚躍醫療深化合作，從5G產線延伸至AI可穿戴設備全鏈條共創。依託聯通算力雲平臺重構設備感知力，推動醫療器械“硬核進化”，標誌智慧醫療轉型進入深水區。

AIBase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2026AIBase