Google DeepMind Revoluciona la Robótica con Gemini 1.5 y ER 1.5
Editado por: Veronika Radoslavskaya
Google DeepMind ha anunciado el lanzamiento de dos avanzados modelos de inteligencia artificial: Gemini Robotics 1.5 y Gemini Robotics-ER 1.5. Estos modelos representan un avance significativo en la autonomía y adaptabilidad de los robots, permitiéndoles operar de manera más sofisticada en entornos físicos complejos.
Gemini Robotics 1.5 es un modelo de visión-lenguaje-acción (VLA) capaz de interpretar información visual e instrucciones para generar comandos motores. Una de sus características más destacadas es la transferencia de movimientos aprendidos entre diferentes configuraciones de robots, lo que acelera el aprendizaje de habilidades y reduce la necesidad de reentrenamiento. Este modelo también puede "pensar antes de actuar", mostrando su proceso de razonamiento para una mayor transparencia.
Por su parte, Gemini Robotics-ER 1.5 es un modelo de razonamiento incorporado (ER) especializado en la comprensión de espacios físicos y la planificación de tareas de múltiples pasos. Este modelo puede acceder a herramientas digitales como Google Search para obtener información y utilizar funciones definidas por el usuario. Ha alcanzado un rendimiento de vanguardia en puntos de referencia de razonamiento incorporado, como ERQA y Point-Bench.
La sinergia entre ambos modelos es clave: ER 1.5 se encarga de la planificación de alto nivel y la generación de instrucciones, mientras que VLA 1.5 ejecuta las acciones físicas. Esta arquitectura colaborativa mejora la generalización de los robots en diversas tareas y entornos. La disponibilidad de Gemini Robotics-ER 1.5 a través de la API de Gemini en Google AI Studio abre nuevas posibilidades para los desarrolladores, impulsando la innovación en el campo de la robótica y la "IA Física".
45 Vues
Fuentes
Silicon Republic
Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models
Gemini Robotics - Google DeepMind
Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers
Lea más noticias sobre este tema:
Introducing Nano Banana 2: Our best image generation and editing model yet. 🍌 Pro-level quality, at Flash speed. Rolling out today across @GeminiApp, Search, and our developer and creativity tools.
¿Encontró un error o inexactitud?Consideraremos sus comentarios lo antes posible.


