Google DeepMind a annoncé le 5 août 2025 le lancement de Genie 3, un modèle d'intelligence artificielle révolutionnaire capable de générer des environnements 3D interactifs en temps réel à partir de simples invites textuelles. Cette avancée marque une étape significative dans le développement des modèles de monde et se positionne comme un jalon essentiel vers l'intelligence artificielle générale (IAG).
Genie 3 surpasse son prédécesseur, Genie 2, en produisant des simulations 3D cohérentes et interactives pendant plusieurs minutes, à une résolution de 720p et une fréquence d'images de 24 images par seconde. Cette capacité permet aux utilisateurs, qu'ils soient humains ou agents IA, de naviguer et d'interagir au sein de ces mondes générés avec une fluidité sans précédent. Le modèle intègre également des « événements mondiaux déclenchés par commande », permettant aux utilisateurs de modifier les environnements en temps réel grâce à des instructions textuelles, comme changer les conditions météorologiques ou introduire de nouveaux éléments. Shlomi Fruchter, directeur de la recherche chez Google DeepMind, a qualifié Genie 3 de « premier modèle de monde généraliste interactif en temps réel ». Cette technologie ouvre des perspectives considérables pour l'entraînement des agents IA, leur permettant d'acquérir des connaissances par l'expérience, à l'instar de l'apprentissage humain. Les chercheurs soulignent que la capacité du modèle à maintenir la cohérence physique et la mémoire visuelle sur des périodes prolongées, jusqu'à une minute, est une avancée majeure pour la création de simulations réalistes et stables.
L'impact potentiel de Genie 3 s'étend au-delà de la recherche en IA. Dans des domaines tels que l'éducation, la formation et le développement de jeux vidéo, la capacité à créer et à modifier dynamiquement des mondes virtuels offre des opportunités d'apprentissage immersives et personnalisées. Les entreprises peuvent exploiter cette technologie pour des simulations complexes, des formations sur mesure ou des expériences client innovantes, rendant les interactions plus engageantes et mémorables. Actuellement disponible en avant-première de recherche limitée, Google DeepMind prévoit d'élargir l'accès à Genie 3 à un public plus large. Cette démarche s'inscrit dans une volonté d'innovation responsable, garantissant que les avancées technologiques soient accompagnées de considérations éthiques pour un déploiement sûr et bénéfique.