Google DeepMind Révolutionne la Robotique avec Gemini 1.5 et ER 1.5: Vers une Autonomie Accrue

Édité par : Veronika Radoslavskaya

Le 25 septembre 2025, Google DeepMind a annoncé le lancement de deux modèles d'intelligence artificielle avancés, Gemini Robotics 1.5 et Gemini Robotics-ER 1.5, marquant une avancée significative dans le domaine de la robotique. Ces innovations visent à doter les robots d'une autonomie, d'une adaptabilité et de capacités de raisonnement considérablement améliorées pour naviguer dans des environnements physiques complexes.

Gemini Robotics 1.5 est un modèle vision-langage-action (VLA) conçu pour interpréter les données visuelles et les instructions afin de générer des commandes motrices. Il permet aux robots d'accomplir des tâches sophistiquées, comme le tri du linge par couleur, et se distingue par sa capacité à transférer les mouvements appris sur différents types de robots sans nécessiter de réentraînement spécifique pour chaque nouveau modèle. Cette polyvalence promet d'accélérer le déploiement et l'efficacité des robots dans diverses applications. Gemini Robotics-ER 1.5, quant à lui, est un modèle de raisonnement incarné (ER) spécialisé dans la compréhension des espaces physiques et la planification de tâches multi-étapes. Il peut accéder à des outils externes tels que Google Search pour obtenir des informations et utiliser des fonctions définies par l'utilisateur, agissant comme un chef d'orchestre pour planifier les actions et prendre des décisions logiques, tandis que Gemini Robotics 1.5 assure l'exécution physique. Cette collaboration synergique vise à améliorer la généralisation des robots à travers différentes tâches et environnements.

Une des avancées majeures réside dans la capacité de ces modèles à "penser avant d'agir". Ils génèrent une séquence interne de raisonnement et d'analyse, rendant leurs décisions plus transparentes et permettant aux robots d'expliquer leur processus de pensée en langage naturel. La capacité d'apprentissage inter-incarnations de Gemini Robotics 1.5 permet le transfert d'expériences entre des robots aux formes très différentes, comme du robot ALOHA2 au robot humanoïde Apollo d'Apptronik, ou au robot à double bras Franka, sans configuration supplémentaire. L'accès à Gemini Robotics-ER 1.5 via l'API Gemini dans Google AI Studio est disponible pour les développeurs, ouvrant de nouvelles perspectives pour l'innovation et une adoption plus large de ces technologies avancées.

Ces avancées représentent une étape cruciale vers la création de robots plus intelligents et plus capables, aptes à naviguer dans les complexités du monde physique avec une dextérité et une intelligence sans précédent. L'objectif ultime est de construire des robots capables de raisonner, planifier et utiliser des outils de manière générale, se rapprochant ainsi de l'intelligence artificielle générale (AGI) dans le monde physique.

Sources

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.