騰訊混元團隊今日宣佈正式發佈並開源“混元3D 世界模型2.0”(HY-World2.0)。作爲多模態世界模型的重大升級,該版本實現了從單純生成視頻向生成“可交互、可編輯3D 資產”的跨越。模型支持文、圖、視頻等多種模態輸入,能夠自動生成、重建並模擬包含人、物、景的完整3D 空間,並支持 Mesh、3DGS 及點雲等多種格式導出,可與 Unity、UE 等主流遊戲引擎工作流無縫對接。

QQ20260416-103610.jpg

技術架構上,HY-World2.0統一了空間理解、生成與重建流程。其核心升級包括:採用端到端隱式學習方案的 HY-Pano-2.0模型,可在無需相機參數的情況下實現360度全景映射;自研空間 Agent 技術結合 VLM 與 navmesh 表徵,賦予模型智能規劃漫遊軌跡的能力;而 WorldStereo 機制則確保了新生成區域與既有場景在幾何與視覺上的高度一致性。

QQ20260416-103545.jpg

QQ20260416-103558.jpg

此外,升級後的 WorldMirror2.0架構支持復刻真實場景,可一次性預測密集點雲與相機參數,實現高精度的數字孿生構建。

相比谷歌 Genie3等主流模型,混元2.0的突破在於生成的資產具備真實物理碰撞屬性,支持角色模式自由探索,顯著降低了遊戲關卡原型與具身智能仿真環境的構建門檻。

此次發佈標誌着騰訊混元在3D 生成領域從“捏物體”進化到“造世界”,通過 SOTA 級的空間一致性記憶機制,將 AI 驅動的3D 內容創作推向實用化階段。