Op 5 augustus 2025 heeft Google DeepMind Genie 3 aangekondigd, een geavanceerd AI-wereldmodel dat interactieve 3D-omgevingen genereert op basis van tekstuele beschrijvingen. Deze technologie, die voortbouwt op eerdere versies zoals Genie 2, biedt aanzienlijke verbeteringen in interactiviteit en consistentie. Waar Genie 2 beperkt was tot korte interacties van 10 tot 20 seconden, kan Genie 3 nu meerdere minuten aan consistente simulaties leveren in 720p-resolutie met 24 frames per seconde.
Een opmerkelijke eigenschap van Genie 3 is het 'visuele geheugen', waarmee objecten en details tot wel een minuut lang onthouden kunnen worden, zelfs als ze buiten beeld zijn. Dit zorgt voor een vloeiendere en realistischere ervaring, vergelijkbaar met die van een videogame. Gebruikers kunnen de gegenereerde omgevingen dynamisch aanpassen met tekstcommando's via 'promptable world events', zoals het veranderen van het weer of het toevoegen van nieuwe personages. Shlomi Fruchter, onderzoeksdirecteur bij Google DeepMind, beschreef Genie 3 als het 'eerste real-time interactieve, algemene wereldmodel'. Deze ontwikkeling is cruciaal voor het trainen van AI-agenten, zoals robots en virtuele assistenten, doordat ze kunnen leren van hun eigen ervaringen in gesimuleerde, maar realistische omgevingen. De potentiële toepassingen liggen in sectoren als gaming, educatie en het trainen van autonome systemen. Momenteel is Genie 3 beschikbaar als een beperkte research preview voor academici en creators, terwijl Google DeepMind het gebruik monitort voor veiligheid en verantwoordelijkheid.