Google DeepMind представляє Gemini Robotics 1.5 та ER 1.5: Нова ера автономії роботів

16:15, 26 вересня

Відредаговано: Veronika Radoslavskaya

25 вересня 2025 року Google DeepMind анонсувала два нові передові моделі штучного інтелекту: Gemini Robotics 1.5 та Gemini Robotics-ER 1.5. Ці розробки спрямовані на значне підвищення автономності, адаптивності та можливостей роботів у складних фізичних середовищах.

Gemini Robotics 1.5, модель бачення-мови-дії (VLA), інтерпретує візуальні дані та інструкції користувача для генерації команд руху. Ключовою особливістю є здатність передавати вивчені рухи між різними типами роботів, що прискорює процес навчання та розгортання нових робочих процесів. Це вирішує проблему тривалого перенавчання роботів для кожної нової конфігурації обладнання.

Gemini Robotics-ER 1.5, модель втіленого міркування (ER), спеціалізується на розумінні фізичних просторів та плануванні багатоетапних завдань. Вона може використовувати інструменти, такі як Google Search, для доступу до інформації та застосовувати визначені користувачем функції. Модель ER 1.5 вже доступна розробникам через Gemini API у Google AI Studio, що сприяє інноваціям та ширшому впровадженню. Gemini Robotics 1.5 наразі доступний для обраних партнерів.

Ці моделі розроблені для спільної роботи: ER-модель керує діями, а VLA-модель їх виконує, що сприяє кращій узагальненій здатності до виконання завдань та роботи в різних середовищах. Gemini Robotics-ER 1.5 демонструє передові результати у тестах на просторове розуміння, перевершуючи моделі, такі як GPT-5 та Gemini 2.5 Flash. Ці досягнення є важливим кроком до створення роботів, здатних до інтелектуальної навігації та маніпуляцій у реальному світі, виходячи за межі простих командних реакцій до систем, що здатні міркувати, планувати та адаптуватися.

Розвиток фізичного штучного інтелекту (Physical AI) стає ключовим трендом у робототехніці, обіцяючи революціонізувати автоматизацію завдяки здатності роботів сприймати, міркувати та адаптуватися до непередбачуваності реального світу. Інтеграція генеративного, аналітичного та фізичного ШІ дозволяє роботам виконувати складні, не повторювані завдання з безпрецедентною спритністю. На відміну від попередніх поколінь, які покладалися на жорстке програмування, сучасні роботи навчаються на досвіді, вдосконалюючи свої навички з часом.

Джерела

Silicon Republic
Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models
Gemini Robotics - Google DeepMind
Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Читайте більше новин на цю тему:

03 жовтня

Браузер Comet від Perplexity став глобальним та безкоштовним, інтегруючи ШІ для покращеної навігації

02 жовтня

Google Представляє Jules Tools: Новий Етап Інтеграції ШІ в Кодування

30 вересня

OpenAI представляє Sora 2: революційний додаток для генерації відео та аудіо вже доступний на iOS

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.

Центр сповіщень

Центр сповіщень

Google DeepMind представляє Gemini Robotics 1.5 та ER 1.5: Нова ера автономії роботів

Джерела

Читайте більше новин на цю тему: