Pika 1.0 的宣傳視頻被一些用戶認爲是“炒作”,但不能否認,它們豐富了人們對多模態 AI 的想象力。多模態 AI 正處於爆發前夜,正走向場景化、實用化、商業化。Pika在技術上屬於行業領先水平。Runway、Stability AI、Midjourney等公司也在佈局AI視頻生成賽道。多模態大模型有望打通物理世界和數字世界之間的屏障。
相關推薦
美團“全能貓”橫空出世!LongCat-Flash-Omni多模態大模型開源即登頂,實時交互快到離譜
美團開源多模態大模型LongCat-Flash-Omni實現技術突破,在多項基準測試中超越閉源競品,達到業界領先水平。該模型支持文本、語音、圖像、視頻的實時融合處理,具備近乎零延遲的交互能力,將本地化多模態AI應用推向新高度。
Nov 5, 2025
107.6k
盲人也能“看見”街景?Google新AI系統讓虛擬探索無障礙,科技向善邁出關鍵一步
谷歌推出StreetReaderAI原型系統,幫助盲人和低視力用戶通過自然語言交互自主探索谷歌街景。該系統融合計算機視覺、地理信息系統和大語言模型,實現多模態AI驅動的實時對話式街景體驗,突破傳統語音播報侷限,提升無障礙城市探索自由度。
Oct 31, 2025
149.9k
智源發佈Emu3.5大模型:以“下一狀態預測”重構多模態智能,具身操作能力驚豔業界
智源研究院發佈Emu3.5多模態世界模型,首次引入自迴歸式“下一狀態預測”技術,推動AI從感知理解邁向智能操作。該模型能在複雜環境中規劃執行跨模態任務,實現多模態AI質的飛躍。
Oct 30, 2025
193.9k
美團發佈 LongCat-Video 視頻生成模型,開實現時序一致性與物理運動合理性
美團LongCat團隊發佈視頻生成模型LongCat-Video,基於DiT架構,能精準重構真實世界動態,支持文生視頻、圖生視頻和視頻續寫功能。這標誌着美團在世界模型領域取得重要進展,該模型是下一代AI核心引擎,助力AI更好地理解和預測現實世界。
Oct 27, 2025
134.0k
百度小度 AI 眼鏡將於百度世界2025大會正式發佈,年內開售
百度將在11月世界2025大會上正式發佈小度AI眼鏡,計劃年內開售。該產品融合多模態AI與可穿戴技術,是百度智能硬件生態的重要佈局。其核心功能包括第一視角拍攝,可實時記錄用戶所見畫面,適用於生活記錄和內容創作。
Oct 21, 2025
145.2k
