Google DeepMind Révolutionne la Robotique avec Gemini 1.5 et ER 1.5: Vers une Autonomie Accrue

16:15, 26 septembre

Édité par : Veronika Radoslavskaya

Le 25 septembre 2025, Google DeepMind a annoncé le lancement de deux modèles d'intelligence artificielle avancés, Gemini Robotics 1.5 et Gemini Robotics-ER 1.5, marquant une avancée significative dans le domaine de la robotique. Ces innovations visent à doter les robots d'une autonomie, d'une adaptabilité et de capacités de raisonnement considérablement améliorées pour naviguer dans des environnements physiques complexes.

Gemini Robotics 1.5 est un modèle vision-langage-action (VLA) conçu pour interpréter les données visuelles et les instructions afin de générer des commandes motrices. Il permet aux robots d'accomplir des tâches sophistiquées, comme le tri du linge par couleur, et se distingue par sa capacité à transférer les mouvements appris sur différents types de robots sans nécessiter de réentraînement spécifique pour chaque nouveau modèle. Cette polyvalence promet d'accélérer le déploiement et l'efficacité des robots dans diverses applications. Gemini Robotics-ER 1.5, quant à lui, est un modèle de raisonnement incarné (ER) spécialisé dans la compréhension des espaces physiques et la planification de tâches multi-étapes. Il peut accéder à des outils externes tels que Google Search pour obtenir des informations et utiliser des fonctions définies par l'utilisateur, agissant comme un chef d'orchestre pour planifier les actions et prendre des décisions logiques, tandis que Gemini Robotics 1.5 assure l'exécution physique. Cette collaboration synergique vise à améliorer la généralisation des robots à travers différentes tâches et environnements.

Une des avancées majeures réside dans la capacité de ces modèles à "penser avant d'agir". Ils génèrent une séquence interne de raisonnement et d'analyse, rendant leurs décisions plus transparentes et permettant aux robots d'expliquer leur processus de pensée en langage naturel. La capacité d'apprentissage inter-incarnations de Gemini Robotics 1.5 permet le transfert d'expériences entre des robots aux formes très différentes, comme du robot ALOHA2 au robot humanoïde Apollo d'Apptronik, ou au robot à double bras Franka, sans configuration supplémentaire. L'accès à Gemini Robotics-ER 1.5 via l'API Gemini dans Google AI Studio est disponible pour les développeurs, ouvrant de nouvelles perspectives pour l'innovation et une adoption plus large de ces technologies avancées.

Ces avancées représentent une étape cruciale vers la création de robots plus intelligents et plus capables, aptes à naviguer dans les complexités du monde physique avec une dextérité et une intelligence sans précédent. L'objectif ultime est de construire des robots capables de raisonner, planifier et utiliser des outils de manière générale, se rapprochant ainsi de l'intelligence artificielle générale (AGI) dans le monde physique.

Sources

Silicon Republic
Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models
Gemini Robotics - Google DeepMind
Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Lisez plus d’actualités sur ce sujet :

03 octobre

Le navigateur Comet de Perplexity, propulsé par l'IA, est désormais accessible gratuitement dans le monde entier

02 octobre

Google Lance Jules Tools: Intégration Profonde des Agents de Codage IA dans les Flux de Travail des Développeurs

30 septembre

OpenAI Lance Sora 2: La Nouvelle Ère de la Génération Vidéo et Audio par IA

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.

Centre de notifications

Centre de notifications

Google DeepMind Révolutionne la Robotique avec Gemini 1.5 et ER 1.5: Vers une Autonomie Accrue

Sources

Lisez plus d’actualités sur ce sujet :