谷歌於4月2日宣佈爲其企業級視頻創作應用 Vids 引入重大升級,通過集成 Veo3.1視頻生成模型與自然語言交互技術,實現從靜態生成向動態“指令控制”的跨越。 此次更新的核心在於賦予 AI 虛擬形象更強的交互能力,用戶僅需輸入簡單的文字提示,即可指揮形象在場景中完成與產品、道具或設備的特定互動,且能在動態輸出中保持角色視覺的一致性。
此外,Vids 進一步整合了多模態能力,在近期加入

爲打通工作流閉環,
與此同時,人工智能領域的競爭態勢正持續升級,微軟於同日發佈了 MAI 系列三款基礎模型,涵蓋25種語言的語音轉錄、音頻生成及視頻生成能力,旨在通過更低的成本門檻挑戰谷歌與 OpenAI 的市場地位。
谷歌自2024年推出 Vids 以來,已迅速迭代了3D 卡通形象及多國語言支持。這種基於提示詞的精細化控制功能,標誌着 AI 視頻工具正從簡單的內容生成轉向更具專業深度的自動化導演階段,將進一步重塑企業內容生產的成本結構與創意邊界。
