谷歌Vids集成 Veo3.1模型，支持文字提示詞指揮 AI 虛擬形象互動

谷歌於4月2日宣佈爲其企業級視頻創作應用 Vids 引入重大升級，通過集成 Veo3.1視頻生成模型與自然語言交互技術，實現從靜態生成向動態“指令控制”的跨越。此次更新的核心在於賦予 AI 虛擬形象更強的交互能力，用戶僅需輸入簡單的文字提示，即可指揮形象在場景中完成與產品、道具或設備的特定互動，且能在動態輸出中保持角色視覺的一致性。

此外，Vids 進一步整合了多模態能力，在近期加入Lyria3系列音頻模型的基礎上，Veo3.1的接入支持生成8秒視頻片段，並向普通用戶及企業高級版賬戶分別提供每月10次至1000次不等的生成配額。

爲打通工作流閉環，Google Vids新增了直接導出至 YouTube 的功能，並配合全新的 Chrome 錄屏擴展程序，構建了從素材捕獲到成品分發的全鏈路。

與此同時，人工智能領域的競爭態勢正持續升級，微軟於同日發佈了 MAI 系列三款基礎模型，涵蓋25種語言的語音轉錄、音頻生成及視頻生成能力，旨在通過更低的成本門檻挑戰谷歌與 OpenAI 的市場地位。

谷歌自2024年推出 Vids 以來，已迅速迭代了3D 卡通形象及多國語言支持。這種基於提示詞的精細化控制功能，標誌着 AI 視頻工具正從簡單的內容生成轉向更具專業深度的自動化導演階段，將進一步重塑企業內容生產的成本結構與創意邊界。

Gemini Veo 3.1上線多圖參考一次合成三元素視頻

谷歌Gemini Pro/Ultra訂閱用戶現可體驗Veo3.1視頻模型，新增“Ingredients to Video”功能：支持同時上傳三張參考圖，分別提取人物、場景與風格特徵，融合生成8秒1080p視頻。生成內容自帶SynthID隱形水印，支持網頁/移動端文本輸入一鍵生成。系統確保跨幀角色一致性與光影連貫，演示案例顯示三張自拍+賽博城市背景+油畫風格圖可合成“印象派未來街頭漫步”視頻。

谷歌Vids集成 Veo3.1模型，支持文字提示詞指揮 AI 虛擬形象互動

相關推薦

谷歌擴大 AI 視頻工具 Flow 訪問權限：支持豎屏與 8 秒 4K 生成

谷歌Veo 3.1重磅升級！多圖參考一致性拉滿+原生豎版+4K超分

谷歌發佈 Veo3.1重磅更新:支持原生豎屏視頻，AI 創作直通 YouTube Shorts

谷歌視頻編輯平臺Vids新功能全員開放，包括AI語音配音、去除冗餘口語、AI 圖像編輯等

Gemini Veo 3.1上線多圖參考一次合成三元素視頻

谷歌Vids集成 Veo3.1模型，支持文字提示詞指揮 AI 虛擬形象互動

相關推薦

谷歌擴大 AI 視頻工具 Flow 訪問權限：支持豎屏與 8 秒 4K 生成

谷歌Veo 3.1重磅升級！多圖參考一致性拉滿+原生豎版+4K超分

谷歌發佈 Veo3.1重磅更新:支持原生豎屏視頻，AI 創作直通 YouTube Shorts

​谷歌視頻編輯平臺Vids新功能全員開放，包括AI語音配音、去除冗餘口語、AI 圖像編輯等

Gemini Veo 3.1上線多圖參考 一次合成三元素視頻

谷歌視頻編輯平臺Vids新功能全員開放，包括AI語音配音、去除冗餘口語、AI 圖像編輯等

Gemini Veo 3.1上線多圖參考一次合成三元素視頻