火山引擎正式上線了豆包視頻生成模型1.0pro(Doubao-Seedance-1.0-pro)的首尾幀能力,這一更新標誌着AI視頻創作在可控性和一致性方面邁出了重要一步。Seedance1.0pro憑藉複雜場景主體一致性、大幅運動的物理合理性以及視頻節奏智能推理等技術優勢,將大幅提升生成視頻的主角跟隨效果,實現精準敘事引導,生成更具沉浸感及表現力的視頻作品。

企業用戶可以通過火山方舟調用Seedance1.0pro API體驗該模型的首尾幀能力,而個人用戶則可以在“火山方舟體驗中心”直接體驗。這一能力的推出,不僅爲專業影像創作者提供了強大的工具,也爲普通用戶開啓了AI視頻創作的新大門。

字節跳動抖音豆包大模型

Seedance1.0pro的首尾幀能力在影視敘事中發揮了重要作用。其核心優勢在於能夠通過增強對“敘事主體”的結構化認知,鎖定核心角色特徵,在動態生成過程中維持物理邏輯與視覺呈現的雙重一致性。例如,在複雜場景中,模型能夠精準識別人臉作爲“生成錨點”,保持主體不畸變、不漂移,過渡幀高度平滑,並完成微表情的精準呈現。此外,在複雜的鏡像場景中,如鏡子、水面、玻璃等反射畫面裏,Seedance1.0pro也能準確還原主體細節。

在大幅運動的場景中,Seedance1.0pro能夠精準捕捉人體運動軌跡,保持動作連貫合理,呈現真實物理運動規律。無論是小男孩的奔跑、翻越、跳海等大幅度動作,還是人物羣像場景中多人的不同動作,模型都能確保動作方向清晰、邏輯合理,共同服務於整體敘事。

Seedance1.0pro還具備深度語義理解能力,能夠讓視頻整體節奏的起承轉合自然流暢。例如,在牆壁突然破裂、大量海水涌入船艙時,水流的撞擊翻涌既符合物理邏輯,與箱子的碰撞銜接也符合視頻節奏的變化。

火山引擎的這一創新不僅推動了AI視頻創作的發展,也爲創作者提供了無限的視角和創意空間。