গুগল ডিপমাইন্ডের জেমিনি রোবোটিক্স ১.৫ এবং ইআর ১.৫: রোবোটিক স্বায়ত্তশাসন ও অভিযোজন ক্ষমতার নতুন দিগন্ত
সম্পাদনা করেছেন: Veronika Radoslavskaya
প্রযুক্তি বিশ্বে আলোড়ন ফেলে গুগল ডিপমাইন্ড সম্প্রতি উন্মোচন করেছে তাদের অত্যাধুনিক দুটি এআই মডেল – জেমিনি রোবোটিক্স ১.৫ এবং জেমিনি রোবোটিক্স-ইআর ১.৫। এই নতুন মডেলগুলি রোবটগুলির স্বায়ত্তশাসন, অভিযোজন ক্ষমতা এবং জটিল শারীরিক পরিবেশে যুক্তিসঙ্গত সিদ্ধান্ত গ্রহণের প্রক্রিয়াকে উল্লেখযোগ্যভাবে উন্নত করবে। এই যুগান্তকারী উদ্ভাবনটি রোবোটিক্স এবং কৃত্রিম বুদ্ধিমত্তার জগতে এক নতুন অধ্যায়ের সূচনা করেছে।
জেমিনি রোবোটিক্স ১.৫ হলো একটি ভিশন-ল্যাঙ্গুয়েজ-অ্যাকশন (VLA) মডেল, যা রোবটকে দৃশ্যমান তথ্য এবং ব্যবহারকারীর নির্দেশনা বুঝতে সাহায্য করে। এর মাধ্যমে রোবটগুলি বিভিন্ন কাজ, যেমন - রং অনুযায়ী কাপড় বাছাই করার মতো জটিল কাজগুলিও সম্পন্ন করতে পারবে। এই মডেলের একটি বিশেষ বৈশিষ্ট্য হলো এটি বিভিন্ন ধরনের রোবটের মধ্যে শেখা নড়াচড়া স্থানান্তর করতে সক্ষম, যা রোবট প্রশিক্ষণের প্রক্রিয়াকে আরও দ্রুত ও কার্যকর করে তুলবে। এটি রোবটকে কোনো কাজ করার আগে চিন্তা করতে এবং তার সিদ্ধান্ত গ্রহণের প্রক্রিয়া ব্যাখ্যা করতে সাহায্য করে, যা রোবটের কার্যকারিতাকে আরও স্বচ্ছ করে তোলে।
অন্যদিকে, জেমিনি রোবোটিক্স-ইআর ১.৫ একটি এমবডেড রিজনিং (ER) মডেল। এটি বিশেষভাবে শারীরিক পরিবেশ বোঝা এবং একাধিক ধাপে সম্পন্ন হওয়া কাজগুলির পরিকল্পনা করার জন্য তৈরি করা হয়েছে। এই মডেলটি গুগল সার্চের মতো টুল ব্যবহার করে তথ্য সংগ্রহ করতে পারে এবং ব্যবহারকারীর সংজ্ঞায়িত ফাংশনগুলিও কাজে লাগাতে পারে। এটি রোবটকে তার চারপাশের পরিবেশ সম্পর্কে উন্নত ধারণা দেয় এবং জটিল সিদ্ধান্ত গ্রহণে সহায়তা করে। এই মডেলটি একাডেমিক বেঞ্চমার্কগুলিতে অত্যাধুনিক কর্মক্ষমতা প্রদর্শন করেছে, যা এর উন্নত যুক্তিসঙ্গত ক্ষমতা প্রমাণ করে।
এই দুটি মডেল একে অপরের পরিপূরক হিসেবে কাজ করার জন্য ডিজাইন করা হয়েছে। ইআর মডেলটি সামগ্রিক কর্মপ্রক্রিয়া পরিচালনা করে এবং ভিএলএ মডেলটি সেই অনুযায়ী নির্দিষ্ট কাজগুলি সম্পাদন করে। এই সমন্বিত পদ্ধতি বিভিন্ন কাজ এবং পরিবেশে রোবটের সাধারণীকরণ ক্ষমতা বাড়াতে সাহায্য করবে। গুগল ডিপমাইন্ডের মতে, এই অগ্রগতিগুলি রোবটদের শারীরিক জগতের জটিলতাগুলি বুদ্ধি ও দক্ষতার সাথে পরিচালনা করার পথে একটি গুরুত্বপূর্ণ পদক্ষেপ।
গুগল এআই স্টুডিওতে জেমিনি এপিআই-এর মাধ্যমে জেমিনি রোবোটিক্স-ইআর ১.৫ ডেভেলপারদের জন্য উপলব্ধ করা হয়েছে, যা উদ্ভাবন এবং ব্যাপক গ্রহণকে উৎসাহিত করবে। যদিও জেমিনি রোবোটিক্স ১.৫ নির্দিষ্ট কিছু অংশীদারের জন্য উপলব্ধ রয়েছে, তবে সামগ্রিক দিকটি নির্দেশ করে যে রোবটগুলি আরও সমন্বিত এবং সক্ষম সহযোগী হয়ে উঠবে। এই মডেলগুলির মাধ্যমে রোবটগুলি কেবল নির্দেশ পালনের চেয়েও বেশি কিছু করতে সক্ষম হবে; তারা যুক্তি দিয়ে পরিকল্পনা করতে, সিদ্ধান্ত নিতে এবং পরিবর্তিত পরিস্থিতির সাথে খাপ খাইয়ে নিতে পারবে।
বিশেষজ্ঞদের মতে, এই ধরনের অগ্রগতিগুলি রোবোটিক্স শিল্পে একটি নতুন যুগের সূচনা করছে, যেখানে রোবটগুলি আরও বেশি স্বায়ত্তশাসিত, অভিযোজনযোগ্য এবং বুদ্ধিমান হয়ে উঠবে। এই প্রযুক্তিগুলি বিভিন্ন শিল্পখাতে এবং দৈনন্দিন জীবনে ব্যাপক প্রভাব ফেলবে বলে আশা করা হচ্ছে।
উৎসসমূহ
Silicon Republic
Google DeepMind Unveils Gemini Robotics 1.5 and ER 1.5 Models
Gemini Robotics - Google DeepMind
Gemini Robotics-ER 1.5 | Gemini API | Google AI for Developers
এই বিষয়ে আরও খবর পড়ুন:
আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?
আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।
