人工智能視頻領域再掀巨浪。近日,字節跳動向部分用戶低調內測其新一代多模態視頻生成模型 Seedance2.0。這款被業內人士譽爲“地表最強”的模型,憑藉其深度整合的原生音視頻生成能力與**“導演級”控制精度**,正迅速改變內容創作的行業格局。

QQ20260210-091340.png

多模態融合與“參考”功能突破

Seedance2.0最大的技術亮點在於其對圖像、視頻、音頻和文本四種輸入的處理能力。用戶可組合多達12個文件(包含9張圖像、3段視頻和3段音頻)進行創作。

  • 動作學習: 該模型能從上傳的參考視頻中學習鏡頭語言、運動軌跡及特效,並能無縫擴展現有片段或替換角色。

  • 原生音效: 與前代不同,2.0版本在生成4到15秒視頻的同時,會自動匹配高度同步的音效、音樂甚至口型,極大降低了後期製作的繁瑣度。

實測反饋:驚豔與爭議並存

知名科技博主“影視颶風”Tim 在測評中連用6次“恐怖”來形容其性能,指出該模型即便在未提供音頻的情況下,也能通過照片精準模擬出其本人的音色及公司大樓未在圖中顯示的背面細節。這種強大的“克隆”能力引發了《黑神話:悟空》製作人馮驥等業界大佬對“信任危機”和版權問題的深度擔憂。目前,字節已緊急暫停了部分敏感的真人蔘考功能。

行業博弈:中國 AI 視頻“雙雄會”

與此同時,快手也在近日推出了 Kling3.0。與 Seedance2.0側重於複雜的多模態參考和運鏡控制不同,Kling3.0在物理反饋、多語言對口型及角色一致性上表現卓越。

兩強對壘直接點燃了二級市場的熱情。據《南華早報》及 A 股市場數據,受這些“奇點級”模型發佈的刺激,國內多家媒體與 AI 概念股股價一度飆升達 20%,資本市場普遍看好 AI 視頻在短劇、動漫及電商領域的商業化前景。