Google DeepMind Lancia Gemini Robotics 1.5 e Gemini Robotics-ER 1.5 per Robot Più Autonomi

Modificato da: Veronika Radoslavskaya

Google DeepMind ha annunciato il lancio di due nuovi modelli avanzati di intelligenza artificiale per la robotica: Gemini Robotics 1.5 e Gemini Robotics-ER 1.5. Questi modelli rappresentano un progresso significativo verso la creazione di robot in grado di operare con maggiore autonomia, adattabilità e capacità di ragionamento in ambienti fisici complessi.

Gemini Robotics 1.5 è un modello vision-language-action (VLA) progettato per interpretare input visivi e istruzioni utente, traducendoli in comandi motori per l'esecuzione di compiti. Una delle sue caratteristiche distintive è la capacità di trasferire abilità motorie apprese tra diverse configurazioni di robot, riducendo la necessità di riaddestramento per ogni nuova piattaforma hardware. Questo trasferimento di apprendimento è stato dimostrato con successo tra bracci robotici e robot umanoidi, accelerando l'acquisizione di nuove competenze. Il modello è inoltre in grado di spiegare il proprio processo decisionale in linguaggio naturale, aumentando la trasparenza delle sue azioni.

Gemini Robotics-ER 1.5, invece, è un modello di ragionamento incarnato (ER) specializzato nella comprensione degli spazi fisici e nella pianificazione di compiti multi-step. Questo modello può accedere a strumenti esterni come Google Search per reperire informazioni e utilizzare funzioni definite dall'utente, permettendo ai robot di affrontare situazioni impreviste e compiti complessi. L'architettura collaborativa tra i due modelli vede Gemini Robotics-ER 1.5 orchestrare le azioni e Gemini Robotics 1.5 eseguirle, con l'obiettivo di migliorare la generalizzazione delle capacità robotiche attraverso compiti e ambienti diversi.

Gemini Robotics-ER 1.5 ha raggiunto prestazioni all'avanguardia in benchmark accademici e interni, dimostrando una notevole capacità di comprensione spaziale. Questi progressi segnano un'evoluzione fondamentale nel campo della robotica, spostando l'attenzione da sistemi che reagiscono semplicemente ai comandi a intelligenze artificiali capaci di ragionare, pianificare e adattarsi in modo proattivo. L'integrazione di questi modelli promette di rivoluzionare settori come la manifattura, la logistica e l'assistenza domestica.

Gemini Robotics-ER 1.5 è ora disponibile per gli sviluppatori tramite l'API Gemini in Google AI Studio, mentre Gemini Robotics 1.5 è accessibile a partner selezionati. L'avvento di questa "intelligenza artificiale fisica" sta trasformando l'automazione, consentendo ai robot di affrontare attività precedentemente troppo complesse o costose da automatizzare, operando con agilità e adattabilità in ambienti dinamici.

Fonti

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.