在2025年7月27日舉辦的2025世界人工智能大會騰訊論壇上,騰訊公司正式發佈了混元3D世界模型1.0版本,並宣佈該模型將全面開源。這一舉措標誌着業界首個支持沉浸漫遊、交互與仿真的開源世界生成模型誕生,爲遊戲開發、虛擬現實(VR)及數字內容創作等領域開闢了全新的可能性。

混元3D世界模型1.0融合了全景視覺生成與分層3D重建技術,能夠接受文字和圖片作爲輸入,快速生成高質量、風格多樣的可漫遊3D場景。這一技術突破極大地簡化了3D場景的構建流程,過去需要專業建模團隊數週才能完成的工作,現在通過簡單的文字指令或圖片上傳,幾分鐘內即可實現。對於遊戲開發者而言,該模型能夠迅速生成包含建築、地形、植被等元素的完整3D場景,輸出的Mesh文件可直接用於遊戲原型搭建或關卡設計,同時支持前景物體調整和天空背景更換,滿足個性化創作需求。即便是沒有建模經驗的普通用戶,也能通過混元3D創作引擎,輕鬆生成360°沉浸式視覺空間,並無縫導入Vision Pro等虛擬頭顯設備,享受沉浸式體驗。

微信截圖_20250727111432.png

混元3D世界模型1.0的核心優勢在於其創新的“語意層次化3D場景表徵及生成算法”。該算法將複雜的3D世界解構爲不同語意層級,實現前景與背景、地面與天空的智能分離,不僅生成視覺效果逼真的整體場景,還能輸出標準化的3D Mesh資產,兼容Unity、Unreal Engine、Blender等主流工具,便於用戶對場景內元素進行獨立編輯或物理仿真,實現了AIGC技術與傳統CG工作流的無縫銜接。與全球領先的開源模型相比,混元3D世界模型1.0在文生世界、圖生世界的美學質量和指令遵循能力等關鍵指標上均實現了全面超越。

此外,騰訊混元還披露了包括端側混合推理語言模型、多模態理解模型、遊戲視覺模型等在內的一系列開源計劃。其中,混元旗艦模型TurboS自年初發布以來,保持着每月一個版本的快速迭代,在代碼生成、理科能力和複雜指令遵循方面均有顯著提升,穩居全球大模型權威排行榜前列。基於TurboS基座開發的混元T1進一步提升了推理能力,展現出國內領先的綜合能力。同時,端到端語音模型混元Voice、多模態理解模型混元Vision等也基於混元大語言模型基座打造,繼承了出色的理解、認知和推理能力,在多模態理解領域屢獲佳績。

騰訊混元在多模態生成方面同樣佈局全面,3D生成能力全球領先。最新發佈的混元3D2.5模型質感大幅提升,在上海人工智能實驗室的評測中排名全球第一。除混元3D世界模型1.0外,騰訊還將在月底開源一系列小尺寸模型,包括0.5B、1.8B、4B、7B混合推理模型,更加輕量且易於部署。同時,多模態理解模型混元-large-vision和專爲遊戲場景優化的交互式遊戲視頻生成框架混元GameCraft等也將於近期對外開源。

騰訊混元還開放了完整的多模態生成能力及工具集插件,陸續開源了業界領先的文生圖、視頻生成和3D生成能力,提供了接近商業模型性能的開源基座,方便社區基於業務和使用場景進行定製。目前,混元3D系列模型的社區下載量已超過230萬次,成爲全球最受歡迎的3D開源模型之一。

騰訊混元 3D 世界模型 1.0:

●項目主頁:https://3d-models.hunyuan.tencent.com/world/

●體驗地址:https://3d.hunyuan.tencent.com/sceneTo3D

●Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1

●Github 項目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0