字節跳動技術團隊宣佈推出一項創新技術,基於DiT大模型與字體級分割的視頻字幕無痕擦除方案,旨在助力短劇等視頻內容的全球化傳播。這一技術突破了傳統字幕擦除方法的侷限,爲短劇出海、跨境電商等新興領域提供了強有力的技術支持。

在全球化內容製作中,原始視頻的中文字幕對於海外觀衆而言不僅是無效信息,還嚴重影響觀看體驗。傳統的字幕添加或馬賽克、GAN(生成對抗網絡)等字幕擦除方案,往往導致畫面雜亂、模糊或幀間閃爍,無法徹底解決這一問題。火山引擎視頻點播推出的這一方案,通過兩大核心技術突破和強大的工程能力,重新定義了字幕擦除標準,實現了全片真實自然的“無痕擦除”,並支持多字幕框、指定時間段的精準擦除。

微信截圖_20250812103606.png

該方案的核心在於兩個技術突破:一是DiT視頻字幕擦除模型,二是字體級分割模型。DiT模型通過強魯棒性預訓練基底、擺脫輔助先驗依賴、兩階段訓練策略提升魯棒性與修復精細度,實現了像素級無痕修復。字體級分割模型則通過精準定位目標區域,實現了從“粗放擦除”到“像素級修復”的轉變,有效避免了傳統塊填充導致的背景模糊或紋理重複問題。

火山引擎多媒體實驗室聯合工程團隊構建了兼顧精度與效率的技術體系,經過超萬集視頻數據集驗證,擦除任務成功率達到100%。創新的視頻分鏡技術結合服務器集羣分佈式計算,顯著提升了視頻處理效率。此外,該方案還支持多語言內容流轉,突破了中英文限制,支持多個小語種字幕擦除,爲全球內容流轉提供了雙向通道。

火山引擎視頻點播形成了“擦除-翻譯-口型同步”的一站式閉環,集成了多種語言翻譯能力,並針對短劇場景優化了俚語與文化語境適配。結合語音韻律與面部動作分析技術,實現了翻譯字幕與人物口型的動態對齊,大幅提升了從原視頻到多語言本地化內容的全流程處理效率。

這一技術的推出,不僅爲短劇出海提供了強有力的技術支持,也爲跨境電商、影視公司等提供了高效的視頻處理方案,使得優質內容的全球化傳播變得更加簡單和高效。火山引擎正通過技術消除視覺隔閡,讓每一個精心打磨的鏡頭都能在全球觀衆眼中綻放原有的光彩。

火山引擎視頻點播官網:

https://console.volcengine.com/vod/