腾讯在2025年世界人工智能大会上发布了混元3D世界模型1.0,并宣布全面开源。该模型融合了全景视觉生成与分层3D重建技术,支持通过文字或图片输入,快速生成360度沉浸式三维场景,用户可在其中自由漫游并进行交互。
混元3D世界模型1.0的核心在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂3D世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产,兼容Unity、Unreal Engine、Blender等主流工具。用户可对场景内元素进行独立编辑或物理仿真,无缝衔接AIGC技术与传统CG工作流。
该模型支持多种输入方式,包括自然语言描述和图像输入。用户可以根据自己的需求选择合适的输入方式,快速生成所需的3D场景。生成的场景支持物理仿真,用户可对场景中的物体进行编辑,如添加行为逻辑、替换天空或地形等,生成的场景支持导出为标准文件,无缝兼容主流开发工具,方便进一步开发。
混元3D世界模型1.0已在GitHub和Hugging Face开源,用户可通过腾讯混元3D创作引擎进行体验。该模型的发布标志着腾讯在3D内容生成领域的进一步突破,为游戏开发、虚拟现实、数字内容创作等领域带来了全新的可能性。