Tencent ha rilasciato Hunyuan 3D World Model 1.0, un modello di intelligenza artificiale open-source capace di generare ambienti 3D interattivi partendo da input testuali o immagini. Annunciato durante la World Artificial Intelligence Conference (WAIC) a Shanghai il 26 luglio 2025, questo strumento consente agli utenti di creare scene 3D navigabili.
Il sistema crea un proxy panoramico a 360 gradi e lo ricostruisce in una mesh 3D stratificata, consentendo agli utenti di esplorare l'ambiente e interagire con gli oggetti. Il modello si basa su un'architettura multistadio che combina la generazione panoramica con la ricostruzione 3D stratificata. Al suo interno, Panorama-DiT, un modello di trasformazione della diffusione, genera viste panoramiche a 360° ad alta risoluzione basate su prompt testuali o immagini di riferimento.
Il modello offre una migliore qualità di generazione, dettagli delle texture e aderenza alle istruzioni rispetto ad altre opzioni open-source. Tencent ha reso il modello disponibile al pubblico per promuovere la collaborazione tra sviluppatori e appassionati. I modelli 3D generati possono essere esportati in formati standard compatibili con motori di simulazione e rendering come Unity e Unreal Engine.
Il mercato globale della realtà virtuale e aumentata dovrebbe raggiungere i 76,7 miliardi di dollari entro il 2026. La tecnologia Hunyuan 3D integra la generazione di proxy panoramici, la stratificazione semantica e la ricostruzione 3D gerarchica per ottenere una generazione di mondo 3D a 360° di alta qualità a livello di scena, supportando sia input di testo che di immagini.
Il modello consente la creazione di mondi virtuali modificabili ed esportabili, rendendo la creazione di contenuti 3D più accessibile.