গুগল ডিপমাইন্ডের জেমিনি রোবোটিক্স ১.৫ এবং ইআর ১.৫: রোবোটিক স্বায়ত্তশাসন ও অভিযোজন ক্ষমতার নতুন দিগন্ত

সম্পাদনা করেছেন: Veronika Radoslavskaya

প্রযুক্তি বিশ্বে আলোড়ন ফেলে গুগল ডিপমাইন্ড সম্প্রতি উন্মোচন করেছে তাদের অত্যাধুনিক দুটি এআই মডেল – জেমিনি রোবোটিক্স ১.৫ এবং জেমিনি রোবোটিক্স-ইআর ১.৫। এই নতুন মডেলগুলি রোবটগুলির স্বায়ত্তশাসন, অভিযোজন ক্ষমতা এবং জটিল শারীরিক পরিবেশে যুক্তিসঙ্গত সিদ্ধান্ত গ্রহণের প্রক্রিয়াকে উল্লেখযোগ্যভাবে উন্নত করবে। এই যুগান্তকারী উদ্ভাবনটি রোবোটিক্স এবং কৃত্রিম বুদ্ধিমত্তার জগতে এক নতুন অধ্যায়ের সূচনা করেছে।

জেমিনি রোবোটিক্স ১.৫ হলো একটি ভিশন-ল্যাঙ্গুয়েজ-অ্যাকশন (VLA) মডেল, যা রোবটকে দৃশ্যমান তথ্য এবং ব্যবহারকারীর নির্দেশনা বুঝতে সাহায্য করে। এর মাধ্যমে রোবটগুলি বিভিন্ন কাজ, যেমন - রং অনুযায়ী কাপড় বাছাই করার মতো জটিল কাজগুলিও সম্পন্ন করতে পারবে। এই মডেলের একটি বিশেষ বৈশিষ্ট্য হলো এটি বিভিন্ন ধরনের রোবটের মধ্যে শেখা নড়াচড়া স্থানান্তর করতে সক্ষম, যা রোবট প্রশিক্ষণের প্রক্রিয়াকে আরও দ্রুত ও কার্যকর করে তুলবে। এটি রোবটকে কোনো কাজ করার আগে চিন্তা করতে এবং তার সিদ্ধান্ত গ্রহণের প্রক্রিয়া ব্যাখ্যা করতে সাহায্য করে, যা রোবটের কার্যকারিতাকে আরও স্বচ্ছ করে তোলে।

অন্যদিকে, জেমিনি রোবোটিক্স-ইআর ১.৫ একটি এমবডেড রিজনিং (ER) মডেল। এটি বিশেষভাবে শারীরিক পরিবেশ বোঝা এবং একাধিক ধাপে সম্পন্ন হওয়া কাজগুলির পরিকল্পনা করার জন্য তৈরি করা হয়েছে। এই মডেলটি গুগল সার্চের মতো টুল ব্যবহার করে তথ্য সংগ্রহ করতে পারে এবং ব্যবহারকারীর সংজ্ঞায়িত ফাংশনগুলিও কাজে লাগাতে পারে। এটি রোবটকে তার চারপাশের পরিবেশ সম্পর্কে উন্নত ধারণা দেয় এবং জটিল সিদ্ধান্ত গ্রহণে সহায়তা করে। এই মডেলটি একাডেমিক বেঞ্চমার্কগুলিতে অত্যাধুনিক কর্মক্ষমতা প্রদর্শন করেছে, যা এর উন্নত যুক্তিসঙ্গত ক্ষমতা প্রমাণ করে।

এই দুটি মডেল একে অপরের পরিপূরক হিসেবে কাজ করার জন্য ডিজাইন করা হয়েছে। ইআর মডেলটি সামগ্রিক কর্মপ্রক্রিয়া পরিচালনা করে এবং ভিএলএ মডেলটি সেই অনুযায়ী নির্দিষ্ট কাজগুলি সম্পাদন করে। এই সমন্বিত পদ্ধতি বিভিন্ন কাজ এবং পরিবেশে রোবটের সাধারণীকরণ ক্ষমতা বাড়াতে সাহায্য করবে। গুগল ডিপমাইন্ডের মতে, এই অগ্রগতিগুলি রোবটদের শারীরিক জগতের জটিলতাগুলি বুদ্ধি ও দক্ষতার সাথে পরিচালনা করার পথে একটি গুরুত্বপূর্ণ পদক্ষেপ।

গুগল এআই স্টুডিওতে জেমিনি এপিআই-এর মাধ্যমে জেমিনি রোবোটিক্স-ইআর ১.৫ ডেভেলপারদের জন্য উপলব্ধ করা হয়েছে, যা উদ্ভাবন এবং ব্যাপক গ্রহণকে উৎসাহিত করবে। যদিও জেমিনি রোবোটিক্স ১.৫ নির্দিষ্ট কিছু অংশীদারের জন্য উপলব্ধ রয়েছে, তবে সামগ্রিক দিকটি নির্দেশ করে যে রোবটগুলি আরও সমন্বিত এবং সক্ষম সহযোগী হয়ে উঠবে। এই মডেলগুলির মাধ্যমে রোবটগুলি কেবল নির্দেশ পালনের চেয়েও বেশি কিছু করতে সক্ষম হবে; তারা যুক্তি দিয়ে পরিকল্পনা করতে, সিদ্ধান্ত নিতে এবং পরিবর্তিত পরিস্থিতির সাথে খাপ খাইয়ে নিতে পারবে।

বিশেষজ্ঞদের মতে, এই ধরনের অগ্রগতিগুলি রোবোটিক্স শিল্পে একটি নতুন যুগের সূচনা করছে, যেখানে রোবটগুলি আরও বেশি স্বায়ত্তশাসিত, অভিযোজনযোগ্য এবং বুদ্ধিমান হয়ে উঠবে। এই প্রযুক্তিগুলি বিভিন্ন শিল্পখাতে এবং দৈনন্দিন জীবনে ব্যাপক প্রভাব ফেলবে বলে আশা করা হচ্ছে।

উৎসসমূহ

  • Silicon Republic

  • Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models

  • Gemini Robotics - Google DeepMind

  • Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।