Google DeepMind'dan Robotik Alanında Devrim Niteliğinde Yenilik: Gemini Robotics 1.5 ve ER 1.5

Düzenleyen: Veronika Radoslavskaya

Google DeepMind, robotların otonomisini ve karmaşık fiziksel ortamlarda akıl yürütme yeteneklerini önemli ölçüde geliştirmek amacıyla Gemini Robotics 1.5 ve Gemini Robotics-ER 1.5 olmak üzere iki yeni yapay zeka modelini tanıttı. Bu modeller, robotların çevrelerini anlayan, planlama yapabilen ve adapte olabilen akıllı varlıklara dönüşümünü hızlandırmayı hedefliyor.

Gemini Robotics 1.5, görsel girdileri ve kullanıcı talimatlarını motor komutlarına çeviren bir vizyon-dil-eylem (VLA) modelidir. Bu model, robotların çamaşırları renge göre ayırmak gibi görevleri yerine getirmesini sağlıyor. En dikkat çekici özelliklerinden biri, öğrenilen hareketleri farklı robot gövdeleri arasında aktarabilmesidir. Bu yetenek, her yeni donanım yapılandırması için kapsamlı yeniden eğitim ihtiyacını ortadan kaldırarak robot öğrenimindeki önemli bir darboğazı çözüyor ve robotların konuşlandırılmasını hızlandırma vaadi taşıyor. Bu teknoloji, öğrenilen becerilerin farklı robot türlerinden diğerlerine aktarılabilmesini sağlayarak robot modellerinin genelliğini genişletiyor.

Gemini Robotics-ER 1.5 ise, fiziksel alanları anlama ve çok adımlı görevleri planlama konusunda uzmanlaşmış bir gömülü akıl yürütme (ER) modelidir. Bu model, Google Arama gibi araçlara erişerek bilgi edinebilir ve kullanıcı tanımlı fonksiyonları kullanabilir. ER modeli, eylemleri koordine ederken, VLA modeli bu eylemleri gerçekleştiriyor. Bu işbirliği mimarisi, görevler ve ortamlar arasında daha fazla genelleme sağlamayı hedefliyor. Gemini Robotics-ER 1.5, fiziksel dünyayı anlama ve dijital araçları yerel olarak çağırma yeteneğiyle, karmaşık görevleri tamamlamak için ayrıntılı, çok adımlı planlar oluşturabiliyor. Bu model, uzamsal anlama konusundaki kıyaslama testlerinde en üst düzey performansı sergiliyor.

Bu iki modelin birlikte çalışması, robotların karmaşık, uzun soluklu görevleri yerine getirmesini sağlıyor. Örneğin, bir robot, yerel atık yönetimi kurallarını çevrimiçi olarak araştırabilir ve ardından çöpleri ayrıştırabilir. Google DeepMind'ın bu yeni modelleri, robotların sadece komutları takip etmek yerine, gerçek dünyadaki karmaşıklıklarla akıllıca ve ustaca başa çıkabilen sistemler olma yolunda atılmış önemli bir adımdır.

Gemini Robotics-ER 1.5'in Google AI Studio'daki Gemini API'si aracılığıyla geliştiricilere sunulması, inovasyonu teşvik eden ve daha geniş çaplı benimsenmeyi sağlayan olumlu bir gelişmedir. Bu gelişmeler, endüstriyel otomasyonun geleceğini şekillendiren yapay zeka ve robotik alanındaki daha geniş eğilimlerle uyumludur; burada adaptif robotlar, verimliliği, güvenliği ve esnekliği artırarak giderek daha önemli bir rol oynamaktadır.

Kaynaklar

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

Bir hata veya yanlışlık buldunuz mu?

Yorumlarınızı en kısa sürede değerlendireceğiz.