Il 5 agosto 2025, Google DeepMind ha svelato Genie 3, un modello di intelligenza artificiale all'avanguardia progettato per generare ambienti 3D interattivi in tempo reale. Questo sviluppo rappresenta un progresso significativo nel campo dei "world model", sistemi AI che creano simulazioni per l'interazione umana e l'addestramento di agenti AI. Genie 3 migliora notevolmente il suo predecessore, Genie 2, offrendo la capacità di produrre diversi minuti di ambienti 3D coerenti e interattivi a una risoluzione di 720p e un frame rate di 24 fotogrammi al secondo, superando i limiti temporali e qualitativi delle versioni precedenti.
Una caratteristica distintiva di Genie 3 è la sua "memoria visiva", che consente al modello di ricordare la posizione degli oggetti e le modifiche ambientali per circa un minuto, anche se non visibili, garantendo continuità e realismo. Il modello introduce anche "eventi mondiali attivabili tramite prompt", permettendo agli utenti di modificare gli ambienti in tempo reale tramite comandi testuali, come alterare le condizioni meteorologiche o aggiungere elementi scenici. Shlomi Fruchter, direttore della ricerca presso Google DeepMind, ha definito Genie 3 il "primo world model generale interattivo in tempo reale". La sua architettura autoregressiva genera ogni fotogramma in sequenza, mantenendo la coerenza e apprendendo le interazioni fisiche intuitive senza un motore fisico codificato. Le potenziali applicazioni spaziano dal settore videoludico alla realtà virtuale, dall'istruzione all'addestramento di agenti AI, rendendolo uno strumento prezioso per addestrare robot e sistemi autonomi a gestire situazioni impreviste. Attualmente, Genie 3 è disponibile come anteprima di ricerca limitata per accademici e creatori selezionati, con piani di espansione dell'accesso futuro, previa attenta supervisione per garantirne sicurezza e responsabilità.