谷歌升級AI視頻生成模型 Veo2，4K分辨率、人類偏好評分優於Sora

谷歌正式發佈了其新一代視頻生成模型 Veo2，旨在與 OpenAI 的 Sora 展開競爭。谷歌表示，Veo2在生成視頻時表現出更高的真實感和細膩度。此次更新不僅提升了視頻質量，還加強了對現實物理和人類運動與表情細微差別的理解。

Veo2的強大功能

谷歌表示，Veo2“對現實世界的物理學以及人類運動和表情的細微差別有更好的理解”。它可以在 Google Labs 的 VideoFX 平臺上使用，但僅限於候補名單。用戶需要通過 Google 表單註冊，並等待 Google 在其選擇的時間臨時授予訪問權限。

谷歌介紹稱，用戶可以根據需求選擇視頻的類型、鏡頭和電影效果，Veo2將能夠生成最高可達4K 分辨率的視頻。

與此相比，原版 Veo 仍然可在 Vertex AI 上使用，Veo2生成的視頻將附帶谷歌的元數據水印 SynthID，以便識別其爲 AI 生成內容。

儘管 Veo2在技術上有所進步，谷歌也承認該模型偶爾會出現 “幻覺”，例如生成多餘的手指，但總體上新版本產生的幻覺現象減少了。

谷歌表示，在它自己的內部測試中，衡量 “整體偏好”（即觀衆更喜歡哪些視頻）和 “及時遵守”(視頻與人類創作者給出的指示的匹配程度)，人類評估者更喜歡Veo，而不是Sora和其他競爭對手的人工智能模型。

Veo2體驗入口:https://labs.google/fx/tools/video-fx

介紹入口：https://deepmind.google/technologies/veo/veo-2/

AI 視頻生成仍需努力

儘管 AI 視頻生成技術正在不斷進步，谷歌與 OpenAI 等大廠商之間的競爭依然激烈。其他一些小型公司，如 RunwayML 和 Luma AI，也在不斷推出新功能以增強其視頻生成能力。

最近，RunwayML 推出了 Gen-3Alpha Turbo 模型的高級控制功能，而 Pika Labs 則發佈了 Pika2.0，允許用戶向視頻中添加自己的角色。

然而，用戶對 AI 生成視頻的信任度依舊不足。Sora 的發佈並沒有徹底消除人們的質疑，部分用戶反饋生成的結果存在物理和解剖學的違背現象。此外，近期的遊戲頒獎典禮中，觀衆對 AI 生成內容的 “AI 混亂” 表示了不滿。

谷歌表示，許多用戶對 Veo2表示出濃厚的興趣，尤其是一些 YouTube 創作者，已經在使用 VideoFX 來爲其短視頻製作背景，以節省時間。

Imagen3的更新

除了 Veo2，谷歌還更新了其圖像生成模型 Imagen3，進一步提升了生成圖像的真實感和色彩鮮豔度。新版本的 Imagen3能夠更加準確地表現多種藝術風格，從攝影寫實主義到印象派，再到抽象和動漫風格。同時，該模型還在遵循用戶指令方面表現得更加出色。

劃重點:
- 🎥 谷歌發佈 Veo2視頻生成模型，聲稱其視頻質量優於 OpenAI 的 Sora。
- 🚀 用戶可通過谷歌表單申請使用 Veo2，生成視頻時可選擇風格和效果。
- 🎨 更新的 Imagen3圖像生成模型能更好地表現各種藝術風格，用戶體驗更佳。

阿里巴巴發佈HappyHorse 1.1 視頻生成模型多維度系統性升級