Google DeepMind lance l'accès anticipé à « Project Genie », son prototype de monde virtuel interactif
Édité par : Veronika Radoslavskaya
Le 29 janvier 2026, Google DeepMind a franchi une étape majeure dans l'évolution de l'intelligence artificielle générative en annonçant l'ouverture d'un accès anticipé limité pour Project Genie. Ce prototype de recherche expérimental représente une avancée significative, permettant de transformer des concepts abstraits en environnements numériques explorables.
Actuellement, cette opportunité technologique est réservée exclusivement aux abonnés de Gemini Ultra résidant aux États-Unis. Ce déploiement sélectif permet à l'entreprise de tester la robustesse de son système dans un cadre contrôlé, tout en offrant aux utilisateurs la possibilité de générer des mondes dynamiques à partir de simples descriptions textuelles ou d'images de référence.
L'architecture de Project Genie repose sur une synergie sophistiquée entre trois systèmes d'intelligence artificielle distincts, chacun jouant un rôle déterminant dans la création de l'expérience utilisateur. Cette structure hybride permet de simuler des environnements complexes avec une réactivité inédite.
Le premier pilier de cette technologie est Genie 3, le modèle de monde (World Model) fondamental développé par DeepMind. Ce système a pour mission de prédire la trame suivante d'une séquence vidéo en fonction des interactions de l'utilisateur, tout en simulant un environnement régi par des lois physiques simplifiées.
Le second composant essentiel est Nano Banana Pro, une variante spécifique du modèle d'image alimenté par Gemini. Ce module est responsable de la conversion de la requête initiale de l'utilisateur en une base visuelle de haute qualité, servant de point de départ indispensable à toute la simulation.
Enfin, le système Gemini agit en tant qu'orchestrateur et moteur de raisonnement pour l'interaction globale. Il gère avec précision la perspective de la caméra et les actions des personnages, garantissant ainsi que la navigation au sein de l'environnement virtuel soit fluide et réponde fidèlement aux commandes de l'utilisateur.
Une distinction fondamentale sépare Project Genie des moteurs de jeu 3D traditionnels basés sur des polygones. Au lieu de s'appuyer sur un rendu géométrique classique, le système génère des flux vidéo interactifs en temps réel, créant une expérience d'exploration unique et presque onirique.
Le dispositif produit un flux continu d'images qui réagissent instantanément aux entrées de contrôle. Cette approche permet de s'affranchir des limites des moteurs de rendu standards pour offrir une plasticité visuelle et une liberté de création qui étaient jusqu'alors inaccessibles.
Étant donné la complexité technologique et l'intensité de calcul requise pour une telle génération en temps réel, cette phase expérimentale est soumise à des contraintes techniques rigoureuses. Les sessions interactives sont ainsi strictement limitées à une durée de 60 secondes par utilisateur.
En ce qui concerne les performances techniques, les environnements sont rendus avec une résolution de 720p à une cadence de 24 images par seconde (FPS). Ces spécifications assurent un équilibre optimal entre la qualité visuelle et la fluidité nécessaire à une interaction immersive sans latence excessive.
Le prototype intègre également une fonctionnalité innovante appelée « remixage ». Cet outil permet aux utilisateurs de modifier des créations existantes en altérant le style artistique ou en redéfinissant les règles environnementales d'un monde déjà généré, offrant ainsi une flexibilité créative décuplée.
Shlomi Fruchter, directeur de recherche chez DeepMind, a souligné que l'objectif principal de ce prototype est de révéler des capacités interactives impossibles à obtenir via les méthodes de rendu conventionnelles. Ce test public constitue une étape cruciale pour la collecte de données d'entraînement à grande échelle.
Les données ainsi recueillies permettront d'affiner la manière dont les modèles de monde appréhendent la physique et la logique spatiale. Cette compréhension approfondie est un prérequis indispensable pour le développement futur de systèmes d'intelligence artificielle plus performants et plus intuitifs.
À terme, ces recherches visent à favoriser l'émergence d'agents d'IA incarnée (embodied AI) plus sûrs pour la robotique et les simulations complexes. En apprenant à interagir avec des environnements virtuels réactifs, ces systèmes pourront mieux naviguer et agir dans le monde physique réel.
Cette phase de test pour Project Genie marque donc non seulement une prouesse technique pour Google DeepMind, mais aussi un jalon stratégique vers une intelligence artificielle capable de comprendre et de simuler la complexité de notre réalité spatiale de manière autonome.
15 Vues
Sources
Cadena 3 Argentina
The Tech Buzz
The Tech Buzz
Android Authority
The Tech Buzz
Google DeepMind: The Podcast
Lisez plus d’actualités sur ce sujet :
Avez-vous trouvé une erreur ou une inexactitude ?Nous étudierons vos commentaires dans les plus brefs délais.
