Google DeepMind Luncurkan Gemini Robotics 1.5 dan ER 1.5: Era Baru Otonomi Robot

Diedit oleh: Veronika Radoslavskaya

Google DeepMind mengumumkan terobosan signifikan dalam dunia robotika dengan peluncuran dua model kecerdasan buatan (AI) canggih: Gemini Robotics 1.5 dan Gemini Robotics-ER 1.5 pada 25 September 2025. Peluncuran ini menandai lompatan besar dalam kemampuan robot untuk beroperasi secara mandiri, beradaptasi dengan lingkungan yang kompleks, dan melakukan penalaran tingkat lanjut.

Gemini Robotics 1.5 adalah model vision-language-action (VLA) yang dirancang untuk menerjemahkan input visual dan instruksi pengguna menjadi perintah motorik, memungkinkan robot melaksanakan tugas-tugas rumit dengan presisi yang belum pernah terjadi sebelumnya. Salah satu fitur utamanya adalah kemampuannya untuk mentransfer gerakan yang telah dipelajari ke berbagai jenis robot fisik, yang secara drastis mempercepat proses pembelajaran dan adaptasi robot pada perangkat keras baru. Hal ini mengatasi hambatan signifikan dalam pembelajaran robot, yaitu kebutuhan untuk melatih ulang secara ekstensif untuk setiap konfigurasi perangkat keras yang berbeda.

Sementara itu, Gemini Robotics-ER 1.5 adalah model embodied reasoning (ER) yang berspesialisasi dalam pemahaman ruang fisik dan perencanaan tugas multi-langkah. Model ini dapat mengakses alat eksternal seperti Google Search untuk mendapatkan informasi relevan dan memanfaatkan fungsi yang ditentukan pengguna. Kemampuan ini memungkinkan robot untuk tidak hanya bereaksi terhadap perintah, tetapi juga untuk bernalar, merencanakan, dan beradaptasi secara aktif dalam lingkungan yang dinamis. Gemini Robotics-ER 1.5 kini tersedia bagi para pengembang melalui Gemini API di Google AI Studio.

Kedua model ini dirancang untuk bekerja secara kolaboratif, dengan model ER bertindak sebagai "otak" tingkat tinggi yang mengorkestrasi aktivitas robot, sementara model VLA mengeksekusi tindakan yang diperintahkan. Arsitektur kolaboratif ini bertujuan untuk meningkatkan generalisasi di berbagai tugas dan lingkungan, membawa robot selangkah lebih dekat ke kecerdasan buatan umum (AGI) di dunia fisik. Kemampuan baru ini memungkinkan robot untuk melakukan tugas-tugas yang sebelumnya sangat menantang, seperti mencari panduan daur ulang lokal secara online sebelum memilah sampah. Google DeepMind menekankan bahwa kemajuan ini merupakan langkah penting menuju penciptaan robot yang mampu menavigasi kompleksitas dunia fisik dengan kecerdasan dan ketangkasan, menandai pergeseran dari model yang hanya bereaksi terhadap perintah menjadi sistem yang dapat bernalar, merencanakan, dan beradaptasi. Kemampuan transfer pembelajaran antar robot yang berbeda merupakan terobosan lain yang mengatasi masalah kekurangan data pelatihan berkualitas dalam robotika. Kemajuan ini secara keseluruhan menunjukkan masa depan di mana robot menjadi mitra yang lebih terintegrasi dan mampu dalam tugas-tugas fisik.

Sumber-sumber

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.