Google DeepMind Nâng Cấp Robot Với Gemini 1.5: Tự Chủ và Thích Ứng Vượt Trội

Chỉnh sửa bởi: Veronika Radoslavskaya

Vào ngày 25 tháng 9 năm 2025, Google DeepMind đã công bố hai mô hình AI mới, Gemini Robotics 1.5 và Gemini Robotics-ER 1.5, đánh dấu một bước tiến quan trọng trong khả năng tự chủ và thích ứng của robot trong môi trường vật lý phức tạp.

Gemini Robotics 1.5, một mô hình ngôn ngữ-hành động thị giác (VLA), có khả năng diễn giải đầu vào trực quan và hướng dẫn của người dùng để tạo ra các lệnh vận động. Mô hình này cho phép robot thực hiện các nhiệm vụ phức tạp, như phân loại quần áo theo màu sắc, và có khả năng chuyển giao các chuyển động đã học được giữa các dạng robot khác nhau. Khác với các robot trước đây thường chỉ thực hiện lệnh đơn lẻ, Gemini Robotics 1.5 có thể "suy nghĩ trước khi hành động", chia nhỏ các nhiệm vụ dài thành các phần nhỏ hơn và minh bạch hóa các bước suy luận của mình.

Song hành cùng Gemini Robotics 1.5 là Gemini Robotics-ER 1.5, một mô hình suy luận hiện thân (ER) chuyên về hiểu không gian vật lý và lập kế hoạch cho các nhiệm vụ đa bước. Mô hình này có thể truy cập các công cụ như Google Search để thu thập thông tin và sử dụng các hàm do người dùng định nghĩa. Ví dụ, robot có thể tìm kiếm quy tắc phân loại rác thải địa phương hoặc kiểm tra dự báo thời tiết để đóng gói hành lý phù hợp. Gemini Robotics-ER 1.5 đã đạt được hiệu suất hàng đầu trên các tiêu chuẩn suy luận hiện thân, cho thấy khả năng hiểu và tương tác sâu sắc hơn với thế giới thực.

Sự kết hợp của hai mô hình này tạo ra một kiến trúc cộng tác mạnh mẽ, trong đó Gemini Robotics-ER 1.5 đóng vai trò là bộ điều phối cấp cao, chịu trách nhiệm lập kế hoạch và đưa ra quyết định logic, còn Gemini Robotics 1.5 thực thi các hành động vật lý dựa trên hướng dẫn đó. Cách tiếp cận này nhằm nâng cao khả năng khái quát hóa trên nhiều nhiệm vụ và môi trường, chuyển đổi từ các hệ thống chỉ phản ứng sang các hệ thống có khả năng suy luận, lập kế hoạch và thích ứng.

Google DeepMind nhấn mạnh tầm quan trọng của sự an toàn trong phát triển AI hiện thân. Gemini Robotics-ER 1.5 đã đạt hiệu suất vượt trội trong các bài kiểm tra an toàn nội bộ, thể hiện cam kết của công ty đối với việc phát triển robot thông minh và đáng tin cậy. Gemini Robotics-ER 1.5 hiện đã được cung cấp cho các nhà phát triển thông qua Gemini API trong Google AI Studio, mở ra cơ hội đổi mới và ứng dụng rộng rãi. Mặc dù Gemini Robotics 1.5 ban đầu chỉ dành cho một số đối tác chọn lọc, nhưng hướng đi chung cho thấy một tương lai nơi robot trở thành những đối tác tích hợp và có năng lực hơn trong các nhiệm vụ vật lý, mang lại ý nghĩa sâu sắc cho nhiều ngành công nghiệp và cuộc sống hàng ngày.

Nguồn

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.