Google DeepMind Revoluciona la Robótica con Gemini 1.5 y ER 1.5

16:15, 26 septiembre

Editado por: Veronika Radoslavskaya

Google DeepMind ha anunciado el lanzamiento de dos avanzados modelos de inteligencia artificial: Gemini Robotics 1.5 y Gemini Robotics-ER 1.5. Estos modelos representan un avance significativo en la autonomía y adaptabilidad de los robots, permitiéndoles operar de manera más sofisticada en entornos físicos complejos.

Gemini Robotics 1.5 es un modelo de visión-lenguaje-acción (VLA) capaz de interpretar información visual e instrucciones para generar comandos motores. Una de sus características más destacadas es la transferencia de movimientos aprendidos entre diferentes configuraciones de robots, lo que acelera el aprendizaje de habilidades y reduce la necesidad de reentrenamiento. Este modelo también puede "pensar antes de actuar", mostrando su proceso de razonamiento para una mayor transparencia.

Por su parte, Gemini Robotics-ER 1.5 es un modelo de razonamiento incorporado (ER) especializado en la comprensión de espacios físicos y la planificación de tareas de múltiples pasos. Este modelo puede acceder a herramientas digitales como Google Search para obtener información y utilizar funciones definidas por el usuario. Ha alcanzado un rendimiento de vanguardia en puntos de referencia de razonamiento incorporado, como ERQA y Point-Bench.

La sinergia entre ambos modelos es clave: ER 1.5 se encarga de la planificación de alto nivel y la generación de instrucciones, mientras que VLA 1.5 ejecuta las acciones físicas. Esta arquitectura colaborativa mejora la generalización de los robots en diversas tareas y entornos. La disponibilidad de Gemini Robotics-ER 1.5 a través de la API de Gemini en Google AI Studio abre nuevas posibilidades para los desarrolladores, impulsando la innovación en el campo de la robótica y la "IA Física".

Fuentes

Silicon Republic
Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models
Gemini Robotics - Google DeepMind
Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Lea más noticias sobre este tema:

03 octubre

Perplexity Lanza su Navegador Comet Globalmente y Gratis, Integrando IA para una Navegación Revolucionaria

02 octubre

Google Lanza Jules Tools: CLI y API para Potenciar la Integración de Agentes de Codificación IA

30 septiembre

OpenAI Lanza Sora 2: Generación Avanzada de Video y Audio con App para iOS

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.

Centro de notificaciones

Centro de notificaciones

Google DeepMind Revoluciona la Robótica con Gemini 1.5 y ER 1.5

Fuentes

Lea más noticias sobre este tema: