Google DeepMind heeft Genie 3 aangekondigd, een geavanceerd AI-model dat interactieve 3D-omgevingen kan genereren uitsluitend op basis van tekstuele beschrijvingen. Dit model, dat op 6 augustus 2025 werd geïntroduceerd, stelt gebruikers in staat om virtuele werelden in real-time te creëren en te verkennen met een resolutie van 720p en 24 frames per seconde. Genie 3 vertegenwoordigt een significante vooruitgang in AI-gedreven simulaties, door de grenzen tussen digitale creatie en interactieve ervaring te vervagen.
Genie 3 onderscheidt zich door zijn vermogen om dynamische 3D-ruimtes te bouwen en te navigeren die gedurende enkele minuten consistent blijven, wat langdurige exploratie mogelijk maakt zonder visuele degradatie. Een opmerkelijke eigenschap is de ondersteuning voor 'promptable world events', waarmee gebruikers real-time aanpassingen kunnen doorvoeren, zoals het veranderen van het weer of het introduceren van nieuwe personages. Dit wordt mogelijk gemaakt door een autoregressieve pijplijn die elke frame opnieuw analyseert, waardoor het model in staat is om terug te keren naar eerdere scènes en wijzigingen naadloos te integreren. In tegenstelling tot eerdere modellen, zoals Genie 2, dat beperkt was tot kortere interacties en lagere resoluties, biedt Genie 3 een verbeterde visuele geheugenfunctie en een grotere temporele coherentie.
De potentiële toepassingen van Genie 3 zijn breed. In de gamewereld kunnen ontwikkelaars snel prototypes van game-omgevingen creëren, wat het ontwikkelproces aanzienlijk versnelt. Voor het onderwijs opent het deuren naar meeslepende leerervaringen, waarbij studenten virtuele werelden kunnen verkennen die aansluiten bij hun leerdoelen. Onderzoekers kunnen Genie 3 gebruiken om AI-agenten te trainen in dynamische en adaptieve virtuele omgevingen, wat cruciaal is voor de ontwikkeling van robots en autonome systemen. De technologie wordt momenteel aangeboden als een beperkte research preview, wat Google DeepMind de gelegenheid geeft om feedback te verzamelen en de veiligheid en ethische aspecten te evalueren voordat een bredere uitrol plaatsvindt.
Wat Genie 3 uniek maakt, is het vermogen om omgevingen frame-voor-frame te genereren zonder afhankelijk te zijn van vooraf gedefinieerde 3D-assets, zoals bij NeRFs of Gaussian Splatting. Dit biedt ongekende flexibiliteit en schaalbaarheid. De AI kan objecten plaatsen, hun locaties onthouden en gebruikers in staat stellen om terug te keren naar deze plekken, wat de geavanceerde visuele geheugencapaciteit benadrukt. Hoewel de technologie nog beperkingen kent, zoals het ontbreken van geografische nauwkeurigheid en uitdagingen met tekstweergave binnen de gegenereerde omgevingen, vertegenwoordigt Genie 3 een significante stap voorwaarts in de evolutie van AI-gedreven simulaties en interactieve werelden.