谷歌正式發佈了其新一代視頻生成模型 Veo2,旨在與 OpenAI 的 Sora 展開競爭。谷歌表示,Veo2在生成視頻時表現出更高的真實感和細膩度。此次更新不僅提升了視頻質量,還加強了對現實物理和人類運動與表情細微差別的理解。
Veo2的強大功能
谷歌表示,Veo2“對現實世界的物理學以及人類運動和表情的細微差別有更好的理解”。它可以在 Google Labs 的 VideoFX 平臺上使用,但僅限於候補名單。用戶需要通過 Google 表單註冊,並等待 Google 在其選擇的時間臨時授予訪問權限。
谷歌介紹稱,用戶可以根據需求選擇視頻的類型、鏡頭和電影效果,Veo2將能夠生成最高可達4K 分辨率的視頻。
與此相比,原版 Veo 仍然可在 Vertex AI 上使用,Veo2生成的視頻將附帶谷歌的元數據水印 SynthID,以便識別其爲 AI 生成內容。
儘管 Veo2在技術上有所進步,谷歌也承認該模型偶爾會出現 “幻覺”,例如生成多餘的手指,但總體上新版本產生的幻覺現象減少了。
谷歌表示,在它自己的內部測試中,衡量 “整體偏好”(即觀衆更喜歡哪些視頻)和 “及時遵守”(視頻與人類創作者給出的指示的匹配程度),人類評估者更喜歡Veo,而不是Sora和其他競爭對手的人工智能模型。
Veo2體驗入口:https://labs.google/fx/tools/video-fx
介紹入口:https://deepmind.google/technologies/veo/veo-2/
AI 視頻生成仍需努力
儘管 AI 視頻生成技術正在不斷進步,谷歌與 OpenAI 等大廠商之間的競爭依然激烈。其他一些小型公司,如 RunwayML 和 Luma AI,也在不斷推出新功能以增強其視頻生成能力。
最近,RunwayML 推出了 Gen-3Alpha Turbo 模型的高級控制功能,而 Pika Labs 則發佈了 Pika2.0,允許用戶向視頻中添加自己的角色。
然而,用戶對 AI 生成視頻的信任度依舊不足。Sora 的發佈並沒有徹底消除人們的質疑,部分用戶反饋生成的結果存在物理和解剖學的違背現象。此外,近期的遊戲頒獎典禮中,觀衆對 AI 生成內容的 “AI 混亂” 表示了不滿。
谷歌表示,許多用戶對 Veo2表示出濃厚的興趣,尤其是一些 YouTube 創作者,已經在使用 VideoFX 來爲其短視頻製作背景,以節省時間。
Imagen3的更新
除了 Veo2,谷歌還更新了其圖像生成模型 Imagen3,進一步提升了生成圖像的真實感和色彩鮮豔度。新版本的 Imagen3能夠更加準確地表現多種藝術風格,從攝影寫實主義到印象派,再到抽象和動漫風格。同時,該模型還在遵循用戶指令方面表現得更加出色。
劃重點:
- 🎥 谷歌發佈 Veo2視頻生成模型,聲稱其視頻質量優於 OpenAI 的 Sora。
- 🚀 用戶可通過谷歌表單申請使用 Veo2,生成視頻時可選擇風格和效果。
- 🎨 更新的 Imagen3圖像生成模型能更好地表現各種藝術風格,用戶體驗更佳。