近日,谷歌對 Gemini 應用進行了更新,爲用戶提供了全新的 AI 視頻生成控制方式。用戶現在可以在單個視頻提示中上傳多張參考圖像。系統將根據這些圖像及文本生成視頻和音頻,這一新功能使用戶能夠更直接地掌控最終視頻的外觀和聲音。

image.png

谷歌此前已在其擴展視頻 AI 平臺 Flow 中測試了這一功能。Flow 不僅支持擴展現有視頻片段和拼接多個場景,還提供了比 Gemini 應用更高的視頻配額。根據谷歌的說法,自10月中旬發佈的 Veo3.1版本相比 Veo3.0在紋理真實感、輸入保真度和音頻質量方面都有顯著提升。

通過這次更新,用戶能夠更靈活地利用 AI 工具,創造出更符合自己需求的內容。多參考圖像的上傳功能,意味着創作者可以在視頻製作中融入更多的個性化元素,爲觀衆提供更豐富的視覺和聽覺體驗。

在當前 AI 技術飛速發展的時代,谷歌的這一舉措展示了其在視頻生成領域的持續創新。隨着用戶需求的多樣化,AI 工具的靈活性和可定製性愈發重要,Gemini 的新功能無疑將吸引更多創作者的關注與使用。

劃重點:

🌟 用戶可上傳多張參考圖像來引導 AI 生成視頻和音頻。  

🎥 新功能提升了用戶對視頻最終效果的控制權。  

🔊 Veo3.1版本在視頻質量和音頻體驗上相較於前版本有明顯改進。