腾讯混元3D世界模型正式发布并开源,引领AI生成新纪元。
2025年7月27日,在2025世界人工智能大会腾讯论坛上,腾讯正式发布了混元3D世界模型1.0,并宣布全面开源。这一举措标志着腾讯在人工智能领域持续加大技术投入与开放力度,进一步推动行业生态的发展。模型的开源有助于更多开发者和研究者参与技术迭代,促进3D生成技术的普及与应用。随着AI技术的不断演进,此类开放合作模式或将加速创新成果的落地与转化。
据介绍,这是业界首个开源、可沉浸漫游、可交互、可仿真的世界生成模型,为游戏开发、VR、数字内容创作等领域开启了全新的可能性。除了3D世界模型之外,腾讯混元还公布了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。 从技术发展的角度来看,这一系列开源模型的推出不仅展示了腾讯在AI领域持续深耕的决心,也为开发者和研究者提供了更丰富的工具和平台。这种开放姿态有助于推动整个行业生态的繁荣,促进更多创新应用的诞生。同时,也反映出当前AI技术正逐步向更通用、更智能的方向演进,未来在多个应用场景中将发挥更大作用。
腾讯混元 3D 世界模型 1.0 融合了全景视觉生成与分层 3D 重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游 3D 场景生成。过去需要专业建模团队数周才能搭建的 3D 虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成。
对于游戏开发者来说,混元3D世界模型显著降低了3D场景的构建难度,只需输入简单的指令,系统就能迅速生成包含建筑、地形和植被的完整3D场景。输出的Mesh文件可用于游戏原型开发或关卡设计,同时支持对前景物体进行调整和更换天空背景,满足多样化的创作需求。
无建模经验的普通用户,借助混元3D创作引擎,只需一句描述或一张图片,就能快速构建出360°沉浸式视觉空间。生成的场景可直接导入VisionPro等虚拟现实头显设备,实现无缝体验,带来更加身临其境的视觉感受。 我认为,这种技术的出现极大降低了内容创作的门槛,使得更多普通人能够参与到三维空间的构建中来。随着虚拟现实技术的不断发展,未来这种便捷的创作方式或将改变内容生产与消费的方式,推动更多沉浸式应用的普及。
据官方介绍,混元3D世界模型1.0的核心技术在于其创新的「语意层次化3D场景表征及生成算法」。该算法能够将复杂的3D世界分解为多个语义层级,实现对前景与背景、地面与天空的智能区分。不仅能够生成视觉效果高度逼真的整体场景,还能输出标准化的3DMesh资产,支持Unity、Unreal Engine、Blender等主流工具。用户可对场景中的各个元素进行独立编辑或进行物理仿真,从而实现AIGC技术与传统CG工作流程的无缝对接。
与全球领先的开源模型相比,混元3D世界模型1.0在文本生成场景、图像生成场景的美学表现以及指令执行能力等关键指标上,全面超越当前最先进的开源模型。
腾讯混元 3D 世界模型 1.0:
项目主页:https://3d-models.hunyuan.tencent.com/world/
体验地址:https://3d.hunyuan.tencent.com/sceneTo3D
Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1
Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
留言评论
(已有 0 条评论)暂无评论,成为第一个评论者吧!