中國AI視頻生成領域領軍者Vidu近日宣佈,其Q1模型迎來重大升級,推出了全新的“參考轉視頻”(Reference-to-Video)功能,允許用戶上傳最多七張參考圖像,生成視覺一致性極高的1080p視頻。這一功能突破了傳統AI視頻生成在多場景和多主體一致性上的瓶頸,爲創作者提供了前所未有的靈活性和創作自由。
參考轉視頻:七張圖像解鎖複雜敘事
Vidu Q1的“參考轉視頻”功能是此次更新的核心亮點。用戶可上傳最多七張參考圖像,包括人物、場景、道具等元素,結合文本提示詞生成高質量視頻。Vidu Q1通過先進的語義融合技術,確保多張圖像中的元素在視頻中保持高度一致,避免了傳統AI視頻生成中常見的場景斷裂或角色失真問題。
例如,用戶可上傳一張人物照片、一張森林背景和一張動物圖像,輸入提示詞:“一名女性在森林中彈吉他,貓頭鷹停在樹枝上。”Vidu Q1能夠智能生成包含吉他演奏動作、森林環境和貓頭鷹的視頻,畫面細節如服裝紋理、背景光影和動物動作均高度逼真。這一功能爲動畫、短視頻和廣告創作者提供了強大的工具,顯著降低了複雜場景的製作門檻。
多主體一致性:打造連貫視覺體驗
Vidu Q1的多主體一致性(Multiple-Entity Consistency)技術是其核心競爭力之一。用戶可通過上傳不同類型的參考圖像(如角色、物體、環境),生成包含多主體互動的視頻,且每個主體的特徵在整個視頻中保持穩定。例如,上傳一張角色照片、一件花紋服裝和一輛自行車圖片,Vidu Q1可生成一段角色穿着指定服裝、騎行自行車的流暢視頻,細節如花紋和自行車造型均與參考圖像高度吻合。
與上一代模型相比,Q1在畫面細節和動作流暢度上顯著提升,支持多角度鏡頭切換和動態場景過渡,確保360°視角下的視覺一致性。這一功能尤其適合動漫、遊戲預告片和虛擬場景模擬等需要複雜敘事的場景,爲專業創作者提供了接近傳統影視製作的創作體驗。