Google DeepMind rewolucjonizuje robotykę dzięki Gemini Robotics 1.5 i ER 1.5

Edytowane przez: Veronika Radoslavskaya

Google DeepMind zaprezentowało przełomowe modele sztucznej inteligencji, Gemini Robotics 1.5 i Gemini Robotics-ER 1.5, które znacząco podnoszą autonomię, zdolność adaptacji i możliwości rozumowania robotów w złożonych środowiskach fizycznych. Ogłoszone 25 września 2025 roku, modele te stanowią znaczący krok w kierunku tworzenia robotów zdolnych do nawigacji w skomplikowanym świecie rzeczywistym, wykraczając poza proste reagowanie na polecenia w stronę systemów zdolnych do rozumowania, planowania i adaptacji.

Gemini Robotics 1.5, model wizualno-językowo-akcji (VLA), przekształca dane wizualne i instrukcje w komendy ruchowe, umożliwiając robotom wykonywanie zadań takich jak sortowanie prania według koloru. Kluczową cechą jest jego zdolność do przenoszenia nauczonych ruchów między różnymi ucieleśnieniami robotów, co znacznie przyspiesza proces uczenia się nowych zachowań i zwiększa wszechstronność robotów. Testy wykazały, że umiejętności nauczone na robocie ALOHA2 z podwójnymi ramionami mogły być z powodzeniem replikowane na humanoidalnym robocie Apollo firmy Apptronik oraz na robocie Franka, co świadczy o jego zdolności do adaptacji do różnorodnych form robotów.

Z kolei Gemini Robotics-ER 1.5, model rozumowania ucieleśnionego (ER), specjalizuje się w rozumieniu przestrzeni fizycznych i planowaniu wieloetapowych zadań. Model ten potrafi korzystać z narzędzi takich jak Google Search do pozyskiwania informacji w czasie rzeczywistym, co pozwala robotom na przykład na sprawdzenie lokalnych przepisów dotyczących segregacji odpadów przed ich sortowaniem. ER 1.5 działa jak „wysokopoziomowy mózg”, orkiestrując działania robota, planując logiczne kroki i wykorzystując zewnętrzne narzędzia do rozwiązywania problemów.

Współpraca między tymi dwoma modelami jest kluczowa: ER 1.5 tworzy plan, a Gemini Robotics 1.5 go wykonuje, co zwiększa ogólną zdolność robotów do generalizacji zadań i środowisk. Te innowacje otwierają drzwi do robotów, które potrafią nie tylko wykonywać polecenia, ale także rozumieć kontekst, planować złożone sekwencje działań i adaptować się do nieprzewidzianych sytuacji. Dostępność Gemini Robotics-ER 1.5 poprzez Gemini API w Google AI Studio ma na celu wspieranie innowacji i szerszego zastosowania tych technologii. Rozwój ten stanowi znaczący kamień milowy w kierunku tworzenia robotów zdolnych do inteligentnego i zręcznego poruszania się w złożonościach świata fizycznego, co ma dalekosiężne implikacje dla wielu branż i codziennego życia.

Źródła

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.