騰訊正式推出Hunyuan 3D World Model 1.0,這是一個開源的人工智慧模型,旨在從文本提示或圖像生成互動式3D環境. 該模型於2025年7月26日在上海舉行的世界人工智慧大會(WAIC)上發布.
Hunyuan 3D World Model 1.0結合了全景視覺生成和分層3D重建技術. 該模型的核心是Panorama-DiT,這是一種擴散轉換器模型,經過訓練可以根據文本提示或參考圖像生成高解析度360°全景視圖. 然後,該模型應用語義分層,將全景圖分解為不同的部分,例如天空、地形和前景元素. 接著,系統執行分層網格重建,將分層數據轉換為連貫的3D網格.
Hunyuan 3D模型生成的場景可以匯出為標準格式,與Unity和Unreal Engine等流行的模擬和渲染引擎相容. 該模型目前僅允許基本導航,使用者可以在環境中行走,但還不能操縱物件或與其他使用者互動. 騰訊表示,未來版本將增加互動和多人遊戲功能.
Hunyuan 3D的開源特性旨在促進開發者之間的協作. 該模型已在GitHub和Hugging Face上提供.
騰訊還推出了Hunyuan3D-2,這是一個先進的文本到3D生成模型,可以從文本和圖像創建高解析度3D資產.
Hunyuan 3D World Model 1.0是開源互動式3D世界生成的一個里程碑.