Google DeepMind Revoluciona la Robótica con Gemini 1.5 y ER 1.5
Editado por: Veronika Radoslavskaya
Google DeepMind ha anunciado el lanzamiento de dos avanzados modelos de inteligencia artificial: Gemini Robotics 1.5 y Gemini Robotics-ER 1.5. Estos modelos representan un avance significativo en la autonomía y adaptabilidad de los robots, permitiéndoles operar de manera más sofisticada en entornos físicos complejos.
Gemini Robotics 1.5 es un modelo de visión-lenguaje-acción (VLA) capaz de interpretar información visual e instrucciones para generar comandos motores. Una de sus características más destacadas es la transferencia de movimientos aprendidos entre diferentes configuraciones de robots, lo que acelera el aprendizaje de habilidades y reduce la necesidad de reentrenamiento. Este modelo también puede "pensar antes de actuar", mostrando su proceso de razonamiento para una mayor transparencia.
Por su parte, Gemini Robotics-ER 1.5 es un modelo de razonamiento incorporado (ER) especializado en la comprensión de espacios físicos y la planificación de tareas de múltiples pasos. Este modelo puede acceder a herramientas digitales como Google Search para obtener información y utilizar funciones definidas por el usuario. Ha alcanzado un rendimiento de vanguardia en puntos de referencia de razonamiento incorporado, como ERQA y Point-Bench.
La sinergia entre ambos modelos es clave: ER 1.5 se encarga de la planificación de alto nivel y la generación de instrucciones, mientras que VLA 1.5 ejecuta las acciones físicas. Esta arquitectura colaborativa mejora la generalización de los robots en diversas tareas y entornos. La disponibilidad de Gemini Robotics-ER 1.5 a través de la API de Gemini en Google AI Studio abre nuevas posibilidades para los desarrolladores, impulsando la innovación en el campo de la robótica y la "IA Física".
Fuentes
Silicon Republic
Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models
Gemini Robotics - Google DeepMind
Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers
Lea más noticias sobre este tema:
Google Integra SynthID y C2PA en Gemini, Democratizando la Verificación de Procedencia de IA
Alibaba se Suma a la Carrera de Gafas Inteligentes con las Quark AI, Priorizando la Autonomía de Batería
Perplexity Integra Memoria para Asistentes de IA, Personalizando el Contexto a Través de Múltiples Modelos
¿Encontró un error o inexactitud?
Consideraremos sus comentarios lo antes posible.
