7 月 27 日消息,今天,在 2025 世界人工智能大會騰訊論壇上,騰訊正式發布混元 3D 世界模型 1.0,并全面開源。
據介紹,這是業界首個開源可沉浸漫游、可交互、可仿真的世界生成模型,為游戲開發、VR、數字內容創作等領域帶來了全新的可能性。除 3D 世界模型外,騰訊混元還披露了包括端側混合推理語言模型、多模態理解模型、游戲視覺模型等在內的一系列開源計劃。
騰訊混元 3D 世界模型 1.0 融合了全景視覺生成與分層 3D 重建技術,同時支持文字和圖片輸入,實現了高質量、風格多樣的可漫游 3D 場景生成。過去需要專業建模團隊數周才能搭建的 3D 虛擬世界,現在只需一句文字或一張圖片,幾分鐘內即可生成。
對游戲開發者而言,混元 3D 世界模型極大簡化了 3D 場景構建流程,只需輸入簡單指令,模型即可快速生成包含建筑、地形、植被的完整 3D 場景。輸出的 Mesh 文件可用于游戲原型搭建或關卡設計,還能靈活調整前景物體、更換天空背景,滿足個性化創作需求。
無建模經驗的普通用戶,通過混元 3D 創作引擎,僅需一句話或者一張圖即可快速生成 360° 沉浸式視覺空間,生成的場景可無縫導入 Vision Pro 等虛擬頭顯,帶來沉浸式體驗。
混元 3D 世界模型 1.0 的核心還在于其創新的「語意層次化 3D 場景表征及生成算法」。該算法將復雜 3D 世界解構為不同語意層級,實現前景與背景、地面與天空的智能分離,不僅生成視覺效果逼真的整體場景,還能輸出標準化的 3D Mesh 資產,兼容 Unity、Unreal Engine、Blender 等主流工具。用戶可對場景內元素進行獨立編輯或物理仿真,無縫銜接 AIGC 技術與傳統 CG 工作流。
與全球領先的開源模型相比,混元 3D 世界模型 1.0 在文生世界、圖生世界的美學質量和指令遵循能力等關鍵維度均全面超越當前 SOTA 的開源模型。