谷歌Veo 3強勢發佈：視頻生成邁入音畫同步新時代

谷歌最近推出了其最新的視頻生成模型 Veo3，標誌着 AI 視頻技術的一次重大飛躍。這款新模型實現了音畫同步生成功能，能夠根據用戶的提示詞，自動生成包含對白、脣動對齊和環境音效的高質量視頻。這一突破使得 AI 視頻製作跨越了多模態的邊界，讓視頻不僅會動，還會說話。

Veo3的核心技術是名爲 V2A（Video-to-Audio）的算法，該技術能夠將視頻的視覺信息轉化爲語義信號，並與文本提示結合生成音軌。結合谷歌在 YouTube 等平臺上積累的豐富數據資源，Veo3在音畫合成能力上展現出令人驚歎的表現。目前，該工具雖然僅面向美國的高階訂閱用戶開放，但它的推出無疑給視頻創作領域帶來了新的可能性。

滑雪、極限運動

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

Veo3的強大功能體現在多個方面。首先，它能夠自動生成脣動對齊的對話和擬真音效。例如，用戶只需輸入一句簡單的提示，Veo3就能生成一段完整的場景視頻，包含人物對話、環境音效，甚至是觀衆的笑聲，這種真實感讓人耳目一新。其次，Veo3具備對複雜提示的理解能力，可以生成邏輯連貫、時間有序的視頻片段，這在以往的視頻生成模型中是非常困難的。最後，該模型在處理物理世界聲音方面表現出色，能夠模擬腳步聲、烹飪聲等，使得視頻更具生動性和沉浸感。

儘管 Veo3的短視頻長度限制爲8秒，並且目前僅面向249.99美元的高階訂閱用戶，但其強大的音畫同步能力已引發廣泛關注。未來，隨着技術的進一步發展，Veo3無疑將推動視頻生成技術邁向新的高度。

微軟支持的 AI 模型顛覆颶風預測，速度與成本雙雙優於傳統方法

近日，科學家開發出了一種名爲 “Aurora” 的機器學習模型，它在熱帶氣旋軌跡預測方面表現優於官方機構，並且速度更快、成本更低。Aurora 是由微軟、賓夕法尼亞大學及其他機構的研究人員共同研發的基礎模型，旨在提升地球系統預測的速度和準確性，涵蓋空氣質量、海洋波動、熱帶氣旋軌跡以及高分辨率天氣等領域。圖源備註:圖片由AI生成，圖片授權服務商MidjourneyAurora 的聯合作者、賓夕法尼亞大學機械工程及應用力學副教授巴黎・佩爾迪卡里斯（Paris Perdikaris）表示，Aurora 類似於大型

谷歌Sparkify實驗產品上線，輸入問題秒變動畫短片，複雜知識秒懂

谷歌推出全新實驗性AI產品Sparkify，通過Gemini與Veo模型，用戶只需輸入一個問題或複雜概念，即可在2分鐘內生成直觀的動畫短視頻，深入淺出地講解知識點。從“珍珠奶茶的起源”到“8小時工作制的演變”，Sparkify以其創新的教育應用場景和高效的知識傳播方式引發熱議。AIbase綜合最新社交媒體動態，深入解析Sparkify的技術亮點及其對教育與內容創作領域的深遠影響。內測申請地址：https://sparkify.withgoogle.com/exploreSparkify:從問題到動畫的智能轉化Sparkify是谷歌基於Gemini2.5和Veo2模型打造的AI驅動

Video Ocean發佈2K/4K HDR視頻生成工具，性價比引爆全網

5月21日，潞晨科技旗下Video Ocean重磅推出全新AI視頻生成工具，支持5-10秒內生成2K/4K HDR高質量大片，迅速登頂Product Hunt熱門榜單，引發廣泛關注。Video Ocean提供海量模板，內置Laugh、Cakeify、Crush等炫酷特效，用戶一鍵套用即可輕鬆創作電影級視頻，即使新手也能快速上手，秒變“導演”。該工具支持文生視頻、圖生視頻及角色生視頻功能，滿足多樣化創作需求，從3D寫實到賽博朋克風格均可實現。此外，Video Ocean支持在視頻生成時直接添加背景音樂，進一步提升作品沉浸感。用戶可通過文本描

法院駁回谷歌與 Character.AI 的撤訴請求，AI 引發自殺案訴訟繼續進行

近日，佛羅里達州的一名法官駁回了谷歌及其子公司 Character.AI 提出的撤訴請求，此案涉及一名14歲用戶因使用聊天機器人而導致自殺的指控。此案被認爲是一起具有開創性的訴訟，因其首次將 AI 技術的潛在危害推上法庭。圖源備註：圖片由AI生成，圖片授權服務商Midjourney訴訟於2023年10月提起，原告梅根・加西亞（Megan Garcia）指控 Character.AI 的聊天機器人在未經過充分測試和安全審查的情況下被髮布，從而對其兒子斯圖爾特・塞澤爾(Sewell Setzer III)造成了情感和心理上的傷害，最終導致他於

京醫千詢醫療大模型 2.0 升級，開啓智能診療新時代

近日，京東健康宣佈其自主研發的醫療大模型 “京醫千詢” 將迎來全新2.0版本的升級。這一升級不僅是在技術上的創新，更是對醫療服務的深刻變革，旨在提升臨牀診療的效率和準確性。京醫千詢的2.0版本通過融合多模態感知與深度檢索技術，能夠整合來自不同來源的臨牀信息。這一系統將真實的醫療場景與數據相結合，爲醫生提供一個更爲貼近實際的決策支持工具。升級後的模型在專病治療方面展現出了顯著的優勢，尤其是在複雜的惡性腫瘤、心腦血管等疾病的處理上，能夠更好地支

谷歌Veo 3強勢發佈：視頻生成邁入音畫同步新時代

相關推薦

​微軟支持的 AI 模型顛覆颶風預測，速度與成本雙雙優於傳統方法

谷歌Sparkify實驗產品上線，輸入問題秒變動畫短片，複雜知識秒懂

Video Ocean發佈2K/4K HDR視頻生成工具，性價比引爆全網

​法院駁回谷歌與 Character.AI 的撤訴請求，AI 引發自殺案訴訟繼續進行

京醫千詢醫療大模型 2.0 升級，開啓智能診療新時代

微軟支持的 AI 模型顛覆颶風預測，速度與成本雙雙優於傳統方法

法院駁回谷歌與 Character.AI 的撤訴請求，AI 引發自殺案訴訟繼續進行