AI 視頻成本新高?Google Veo3通過 Gemini API 現已上線

谷歌的旗艦級視頻生成模型 Veo3 現已通過 Gemini API 向開發者開放，提供文本轉視頻功能，並支持同步音頻生成。此舉標誌着 AI 視頻製作邁入新階段，但也伴隨着更高的成本。

Veo3 是谷歌首款能通過單個文本提示生成高分辨率視頻並同步生成對話、音樂和音效的模型。目前，Gemini API 僅限於文本轉視頻功能，但谷歌表示，Gemini 應用中已上線的圖像轉視頻支持也即將推出。

對於希望將高級視頻生成功能集成到自身應用或構建可投入生產原型的開發者而言，此次 API 集成提供了強大助力。Google AI Studio 爲開發者提供了 SDK 模板和入門應用，以幫助他們快速上手。訪問該 API 需要一個已啓用計費功能的活躍 Google Cloud 項目。谷歌透露，Veo3已在 Gemini 應用、Flow 和 Vertex AI 中被使用了數百萬次。

然而，Veo3 的價格使其成爲 AI 視頻生成領域中相對昂貴的選項之一。通過 Gemini API 訪問 Veo3僅在 Google Cloud 付費套餐中可用。以720p、24fps 視頻（含16:9格式音頻）爲例，定價爲 每秒0.75美元，比不含音頻的 Veo2貴25美分。這意味着，一段八秒的視頻需要6美元，而一段五分鐘的視頻則高達225美元。考慮到通常需要多次嘗試才能達到理想效果，實際成本可能會迅速增加。例如，如果需要十倍的素材量才能製作出五分鐘的可用視頻，總成本可能達到2，250美元。儘管如此，谷歌可能認爲在特定用例中，這仍比傳統的視頻製作更具成本效益。谷歌還宣佈了“Veo3Fast”模式，該模式速度更快、價格更低，但目前尚未在 API 中提供。

目前，Veo3的應用主要集中在專業領域。例如，Cartwheel 利用 Veo3將2D 視頻轉換爲逼真的3D 角色動畫，並將其生成的動作映射到客戶項目的裝配模型上。遊戲工作室 Volley 也使用 Veo3爲其角色扮演遊戲《Wit's End》製作過場動畫，從而讓開發者能夠快速嘗試新的故事創意和視覺效果。這些案例表明，谷歌目前更側重於專業級應用，儘管不排除有其他公司在幕後使用 Veo3但尚未公開。

朗新科技首發AI能源大模型，電力交易將實現智能化

朗新科技在鏈博會發布"朗新九功AI能源大模型"，該模型具備兩大核心技術：時序預測引擎基於千億級預訓練數據，電力價格預測準確率超90%，可應對冷啓動環境；AI智能體引擎支持動態數據融合和秒級響應，能7×24小時自動監控電力市場並生成對衝策略。目前已在廣東、山東、浙江等電力現貨市場應用，推動電力交易智能化發展，爲能源管理提供科學決策支持。

Meta 再次挖角蘋果 AI 專家，強化超級智能實驗室佈局

Meta近期從蘋果挖走兩名AI核心專家馬克・李和湯姆・岡特，加入其超級智能實驗室。此前Meta已以超2億美元高薪挖走蘋果AI主管龐若鳴。扎克伯格將AI列爲公司首要任務，計劃投入巨資擴充團隊和數據中心，以保持與OpenAI、谷歌的競爭力。這反映出科技行業AI人才爭奪戰日趨激烈，Meta正通過高薪挖角戰略強化AI研發實力。

Mistral AI 聊天機器人 Le Chat 重磅更新:深度研究、語音交互與高級圖像編輯功能上線

Mistral AI聊天機器人Le Chat迎來重大更新，新增五項核心功能：1）深度研究模式可智能拆解複雜問題並生成結構化報告；2）語音輸入功能基於Voxtral模型實現自然對話；3）"思考模式"採用Magistral模型處理複雜推理；4）與黑森林實驗室合作推出文本修改圖像功能；5）新增項目管理工具可整理對話和文件。這些功能已在網頁端和移動端同步上線，顯著提升AI交互體驗。

首個直播流擴散AI模型MirageLSD震撼發佈，實時視頻轉換開啓無限可能！

全球首款AI實時視頻轉換模型MirageLSD發佈，實現40毫秒超低延遲處理。該模型由Decart AI團隊研發，支持24幀/秒實時轉換任意視頻流，突破傳統視頻生成技術瓶頸。通過手勢控制等簡單交互，用戶可實時改變視頻場景、服裝等元素，大幅降低創作門檻。應用場景涵蓋遊戲開發（30分鐘快速構建遊戲）、直播、動畫製作等領域，其核心技術LSD模型採用Diffusion Forcing技術，解決長時間生成的誤差累積問題。目前該模型已開放試用，將推動AI與內容創作的深度融合。

AI 視頻成本新高?Google Veo3通過 Gemini API 現已上線

相關推薦

朗新科技首發AI能源大模型，電力交易將實現智能化

Meta 再次挖角蘋果 AI 專家，強化超級智能實驗室佈局

Mistral AI 聊天機器人 Le Chat 重磅更新:深度研究、語音交互與高級圖像編輯功能上線

特朗普宣佈 900 億美元 AI 中心投資計劃，谷歌和黑石集團領投

首個直播流擴散AI模型MirageLSD震撼發佈，實時視頻轉換開啓無限可能！

AI 視頻成本新高?Google Veo3通過 Gemini API 現已上線

相關推薦

朗新科技首發AI能源大模型，電力交易將實現智能化

​Meta 再次挖角蘋果 AI 專家，強化超級智能實驗室佈局

Mistral AI 聊天機器人 Le Chat 重磅更新:深度研究、語音交互與高級圖像編輯功能上線

​特朗普宣佈 900 億美元 AI 中心投資計劃，谷歌和黑石集團領投

首個直播流擴散AI模型MirageLSD震撼發佈，實時視頻轉換開啓無限可能！

Meta 再次挖角蘋果 AI 專家，強化超級智能實驗室佈局

特朗普宣佈 900 億美元 AI 中心投資計劃，谷歌和黑石集團領投