【AIbase 報道】2023年8月12日,崑崙萬維在其 SkyWork AI 技術發佈週上,正式推出了全新自研的交互式世界模型 Matrix-Game2.0。作爲 Matrix 系列的升級版本,這一模型不僅是業內首個在通用場景下實現實時長序列生成的開源世界模型,更標誌着崑崙萬維在多模態 AI 領域取得了重要突破。
Matrix-Game2.0在覈心能力上實現了質的飛躍,支持以每秒25幀的速度生成連續的視頻內容,時長可達分鐘級,極大地提升了生成內容的連貫性和實用性。該模型增強了對物理規律和場景語義的理解,用戶通過簡單的指令即可自由探索和操控虛擬環境,獲得更強的沉浸感與可控性。
在技術架構方面,Matrix-Game2.0引入了創新的視覺驅動交互建模方案,摒棄了傳統依賴語言提示的生成模式。其底層基於3D 因果變分自編碼器(VAE)與多模態擴散 Transformer,能夠高效壓縮時空維度,並根據用戶的動作指令逐幀生成符合物理邏輯的動態視覺序列。這種創新架構使模型具備強大的跨域適應性,支持多種場景與視覺風格的模擬。
該模型的發佈突破了傳統交互式世界模型的瓶頸,展示了其在遊戲內容創作、虛擬現實和智能交互系統等領域的廣泛應用潛力。在 GTA 和 Minecraft 等遊戲場景中,Matrix-Game2.0展現了卓越的交互能力,可生成符合物理邏輯的可交互視頻。
崑崙萬維表示,Matrix-Game2.0的持續迭代與開源代表了中國在空間智能研究領域的新里程碑,將對具身智能體訓練、虛擬遊戲世界的快速搭建以及影視與元宇宙內容生產產生深遠影響。