Google DeepMind представляє Gemini Robotics 1.5 та ER 1.5: Нова ера автономії роботів

Відредаговано: Veronika Radoslavskaya

25 вересня 2025 року Google DeepMind анонсувала два нові передові моделі штучного інтелекту: Gemini Robotics 1.5 та Gemini Robotics-ER 1.5. Ці розробки спрямовані на значне підвищення автономності, адаптивності та можливостей роботів у складних фізичних середовищах.

Gemini Robotics 1.5, модель бачення-мови-дії (VLA), інтерпретує візуальні дані та інструкції користувача для генерації команд руху. Ключовою особливістю є здатність передавати вивчені рухи між різними типами роботів, що прискорює процес навчання та розгортання нових робочих процесів. Це вирішує проблему тривалого перенавчання роботів для кожної нової конфігурації обладнання.

Gemini Robotics-ER 1.5, модель втіленого міркування (ER), спеціалізується на розумінні фізичних просторів та плануванні багатоетапних завдань. Вона може використовувати інструменти, такі як Google Search, для доступу до інформації та застосовувати визначені користувачем функції. Модель ER 1.5 вже доступна розробникам через Gemini API у Google AI Studio, що сприяє інноваціям та ширшому впровадженню. Gemini Robotics 1.5 наразі доступний для обраних партнерів.

Ці моделі розроблені для спільної роботи: ER-модель керує діями, а VLA-модель їх виконує, що сприяє кращій узагальненій здатності до виконання завдань та роботи в різних середовищах. Gemini Robotics-ER 1.5 демонструє передові результати у тестах на просторове розуміння, перевершуючи моделі, такі як GPT-5 та Gemini 2.5 Flash. Ці досягнення є важливим кроком до створення роботів, здатних до інтелектуальної навігації та маніпуляцій у реальному світі, виходячи за межі простих командних реакцій до систем, що здатні міркувати, планувати та адаптуватися.

Розвиток фізичного штучного інтелекту (Physical AI) стає ключовим трендом у робототехніці, обіцяючи революціонізувати автоматизацію завдяки здатності роботів сприймати, міркувати та адаптуватися до непередбачуваності реального світу. Інтеграція генеративного, аналітичного та фізичного ШІ дозволяє роботам виконувати складні, не повторювані завдання з безпрецедентною спритністю. На відміну від попередніх поколінь, які покладалися на жорстке програмування, сучасні роботи навчаються на досвіді, вдосконалюючи свої навички з часом.

Джерела

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.