阿里開源Fun-CineForge ：首個電影級多模態配音大模型及大規模數據集問世

近日，由阿里巴巴通義實驗室（Tongyi Lab）語音團隊與中國科學技術大學聯合打造的 Fun-CineForge 項目正式宣佈開源。該項目針對影視劇配音中的口型同步、音色遷移及情感表達等核心難題，推出了一套端到端的生產流水線及大模型解決方案。

核心突破:解決影視配音“齣戲”痛點

傳統的 AI 配音往往面臨口型對不上、情感機械以及難以適應複雜影視場景（如對白、多人混響）的問題。Fun-CineForge 通過以下兩項核心創新實現了質的飛躍:

MLLM 配音模型:不再單純依賴脣部區域學習音視頻對齊，而是基於多模態大模型（MLLM）架構，能夠深度理解影視場景中的角色身份與情感波動。
CineDub 大規模數據集:利用自動化流水線構建了首個帶有豐富標註的中文電視劇配音數據集，涵蓋了獨白、旁白、對白及多發言人等多樣化場景。

項目動態與開源計劃

該項目近期更新頻繁，展示了極高的工程完成度:

2026年1月至3月:先後發佈了中文（CineDub-CN）與英文(CineDub-EN)的數據集樣本及演示 Demo。
2026年3月16日:正式開源推理代碼與模型權重（Checkpoints），開發者現可通過 GitHub 獲取相關資源。
數據集獲取:目前已開放包括《紅樓夢》（中文）和《唐頓莊園》(英文)在內的多個經典劇目數據集樣本供研究使用。

技術實戰:從“對話”到“表演”

根據官方展示的 Demo，該模型在《三國演義》等經典劇集的重塑中表現驚人。通過輸入特定的“情感線索（Clue）”，模型能精準捕捉角色從恐懼到反抗的情感轉變，實現高保真的音色克隆與自然的口型匹配。

Fun-CineForge 的出現，標誌着影視 AI 配音從簡單的“文字轉語音”邁向了具備藝術理解力的“自動化後期生產”，有望大幅降低譯製片及影視劇後期的製作成本。

項目：https://funcineforge.github.io/

Dubformer獲360萬美元融資，情感傳輸技術革新AI配音

近日，人工智能配音初創公司Dubformer成功獲得360萬美元種子輪融資，致力於解決AI配音中情感傳遞的關鍵挑戰。這筆由Almaz Capital領投、s16vc和FinSight參與的投資，將推動公司進一步發展其創新技術。Dubformer與傳統AI配音方案不同，率先採用情感轉移技術，不僅複製聲音，更捕捉原始表演的語調、節奏和情感細微差別。公司創始人兼CEO Anton Dvorkovich強調:"我們不僅重現聲音，還捕捉表演的精髓。"視頻本地化市場價值70億美元，年複合增長率達16%。Dubformer的技術旨在爲媒體公司提供創新解決方案，

告別配音演員？字節跳動PersonaTalk讓AI精準配音，連表情細節都完美還原！

近日，字節跳動開發了一款名爲PersonaTalk的AI模型，該模型可以爲視頻精準配音，並保持口型同步和說話風格的完美匹配。PersonaTalk是一個基於注意力機制的兩階段框架，包括幾何結構和人臉渲染兩部分。在第一階段，它使用混合幾何估計方法從參考視頻中提取說話者的面部幾何係數。然後，它從目標音頻中提取並編碼音頻特徵，並從幾何統計特徵中學習個性化說話風格，將其注入音頻特徵中。最終，它根據參考視頻的幾何係數和目標音頻生成與目標音頻口型同步且保留個性化說話風格的

Viggle AI再推新功能可通過錄制聲音讓角色說話

Viggle AI 最近推出了一項令人興奮的新功能，它不僅能讓你的角色通過錄制的聲音說話，還能實現口型同步。這項創新技術讓用戶能夠完全控制角色的表現方式，無論是唱歌還是跳舞，都能輕鬆實現。這款名爲 Viggle 的應用程序以其創新性在社交媒體上引起了廣泛關注。它利用了先進的 JST-1視頻3D基礎模型，通過一個簡單直觀的用戶界面，讓用戶能夠輕鬆創造和混合視頻內容。無論是想要製作個性化視頻，還是與朋友分享創意，Viggle 都能滿足用戶的多樣化需求。在 Viggle 中，用戶可以利用“

阿里開源Fun-CineForge ：首個電影級多模態配音大模型及大規模數據集問世

核心突破:解決影視配音“齣戲”痛點

項目動態與開源計劃

技術實戰:從“對話”到“表演”

相關推薦

AI 侵權困擾配音演員，張珈銘呼籲行業抵制

通義開源首個影視級配音大模型：AI 終於學會了“有感情地說話”

Dubformer獲360萬美元融資，情感傳輸技術革新AI配音

告別配音演員？字節跳動PersonaTalk讓AI精準配音，連表情細節都完美還原！

Viggle AI再推新功能可通過錄制聲音讓角色說話

阿里​開源Fun-CineForge ：首個電影級多模態配音大模型及大規模數據集問世

核心突破:解決影視配音“齣戲”痛點

項目動態與開源計劃

技術實戰:從“對話”到“表演”

相關推薦

AI 侵權困擾配音演員，張珈銘呼籲行業抵制

通義開源首個影視級配音大模型：AI 終於學會了“有感情地說話”

Dubformer獲360萬美元融資，情感傳輸技術革新AI配音

告別配音演員？字節跳動PersonaTalk讓AI精準配音，連表情細節都完美還原！

Viggle AI再推新功能 可通過錄制聲音讓角色說話

阿里開源Fun-CineForge ：首個電影級多模態配音大模型及大規模數據集問世

Viggle AI再推新功能可通過錄制聲音讓角色說話