生數科技今日宣佈其視頻大模型 Vidu 的 Q1參考生圖功能正式向公衆用戶開放,此次功能的推出旨在突破多主體一致性技術的瓶頸,將 AI 圖像生成與視頻生成的商業生產鏈閉環,推動 AI 多模態創作進入全新階段。

QQ20250909-142106.png

Vidu Q1參考生圖的推出圍繞 “五大亮點” 展開,首先,其支持同時輸入多達7張參考圖,使得創作過程中可控性顯著增強。其次,Vidu Q1在多主體、多場景的生成能力上展現出更強的一致性,無論是在多次生成的情況下,人物和主體的面貌及特徵始終保持一致,確保了高還原度和真實感。此外,用戶只需提供一張圖和一句提示詞,即可自由更換服裝和背景,實現高自由度的創作。

生數科技表示,Vidu Q1參考生圖的多圖參考時代標誌着一致性技術的重大突破,允許用戶在複雜場景下靈活創作,增強了圖像生成的真實感和適用性。以往的 AI 創作工具多以激發靈感爲主,而 Vidu Q1則將 AI 的角色擴展至內容生產的主導者,用戶只需監督,極大降低了內容生產的門檻。

QQ20250909-142136.png

在具體應用方面,Vidu Q1提供了合成、替換和變換三種生成模式。例如,用戶可以將不同人物合成在同一場景中,或是將已有照片的背景更換爲新的場景,從而輕鬆生成個性化的內容。此外,該工具在服裝設計、廣告宣傳、創意營銷等領域的應用潛力巨大,能夠幫助設計師和電商快速產出高質量的素材。

生數科技的此次創新,標誌着 AI 生圖工具在商業化應用上的新里程碑。公司希望通過這一先進技術,推動行業內更多企業和個人用戶開啓多模態創作的新紀元,真正實現 AI 技術爲生產力賦能的目標。