谷歌於4月2日宣佈爲其企業級視頻創作應用 Vids 引入重大升級,通過集成 Veo3.1視頻生成模型與自然語言交互技術,實現從靜態生成向動態“指令控制”的跨越。 此次更新的核心在於賦予 AI 虛擬形象更強的交互能力,用戶僅需輸入簡單的文字提示,即可指揮形象在場景中完成與產品、道具或設備的特定互動,且能在動態輸出中保持角色視覺的一致性。

此外,Vids 進一步整合了多模態能力,在近期加入Lyria3系列音頻模型的基礎上,Veo3.1的接入支持生成8秒視頻片段,並向普通用戶及企業高級版賬戶分別提供每月10次至1000次不等的生成配額。

QQ20260403-091357.jpg

爲打通工作流閉環,Google Vids新增了直接導出至 YouTube 的功能,並配合全新的 Chrome 錄屏擴展程序,構建了從素材捕獲到成品分發的全鏈路。

與此同時,人工智能領域的競爭態勢正持續升級,微軟於同日發佈了 MAI 系列三款基礎模型,涵蓋25種語言的語音轉錄、音頻生成及視頻生成能力,旨在通過更低的成本門檻挑戰谷歌與 OpenAI 的市場地位。

谷歌自2024年推出 Vids 以來,已迅速迭代了3D 卡通形象及多國語言支持。這種基於提示詞的精細化控制功能,標誌着 AI 視頻工具正從簡單的內容生成轉向更具專業深度的自動化導演階段,將進一步重塑企業內容生產的成本結構與創意邊界。