阿里巴巴團隊發佈了肖像視頻生成框架 EMO,能夠生成具有豐富面部表情和頭部姿勢的聲音肖像視頻。EMO利用參考網絡從參考圖像和動作幀中提取特徵,通過預訓練的音頻編碼器處理聲音並嵌入,結合多幀噪聲和麪部區域掩碼生成視頻。實驗結果表明,EMO在表現力和真實感方面優於現有方法。該模型潛在應用方向將提高數字媒體和虛擬內容生成技術水平,但也可能被用作犯罪工具。
相關推薦
邁向智能時代:PayPal 高管揭示 AI 技術的未來趨勢
信息時代因計算機小型化和萬維網普及而興起,但人工智能的崛起標誌着其終結。PayPal高管指出,我們已從信息時代進入新階段,AI正重塑技術格局。
Dec 26, 2025
153.5k
OpenAI、Meta 狂撒真金白銀,AI 人才爭奪戰已捲入底層系統
科技巨頭爲爭奪AI人才,已將戰火蔓延至實習生與研究員。Meta等公司開出媲美全職崗位的高薪,甚至以鉅額投資鎖定核心團隊,凸顯行業對頂尖後備軍的激烈爭奪。
Dec 26, 2025
127.4k
重金挖角半年即傳不和:扎克伯格與 Meta 新 AI 主管陷入關係僵局
Meta CEO扎克伯格斥巨資重塑AI部門,高薪聘請Scale AI創始人亞歷山大·王擔任負責人。然而,據《金融時報》報道,兩人關係近期趨於緊張,天價合作或已進入“蜜月期”終結階段。
Dec 23, 2025
151.6k
時限逼近,軟銀急需225億美元資金支持 OpenAI
軟銀爲履行對OpenAI的承諾,正緊急籌集225億美元資金,可能動用Arm股權相關貸款。作爲OpenAI主要支持者,軟銀參與了5000億美元“星際網”數據中心計劃。
Dec 23, 2025
116.0k
谷歌祭出“降維打擊”:Gemini 3 Flash 免費開放,性能反超 Pro?
谷歌發佈輕量化旗艦模型Gemini3Flash,主打極速與低成本,全面取代前代產品,成爲谷歌搜索AI模式及Gemini應用的默認底層引擎。實測顯示,其速度提升3倍,價格大幅降低,爲企業和開發者帶來高性價比選擇。
Dec 18, 2025
130.3k
