Mountain View, California - Google DeepMind ha presentado Gemini Robotics, un modelo de IA avanzado diseñado para robots autónomos.
Gemini Robotics permite a los robots operar sin depender de la nube, utilizando el procesamiento en el dispositivo para sistemas más rápidos y confiables. El modelo está construido sobre Gemini 2.0 e incorpora capacidades de visión-lenguaje-acción (VLA).
Las características clave incluyen:
Procesamiento en el dispositivo para eliminar la latencia de la red.
Aprendizaje de pocos disparos, que permite la adaptación con 50-100 demostraciones.
Adaptabilidad a varios robots, incluidos ALOHA, Franka FR3 y Apollo.
Google lanzó el SDK de Gemini Robotics a través de un programa selectivo. Esta medida destaca un cambio estratégico hacia la protección de su ventaja competitiva. El mercado global de instalaciones de robots industriales alcanzó los 16.500 millones de dólares, siendo la "IA física" una tendencia clave.
El poder generativo del modelo se extiende más allá de los comandos simples, permitiendo a los robots realizar nuevas tareas. Esto posiciona a Google en el panorama competitivo de la construcción de la próxima generación de máquinas inteligentes.