গুগল জেমিনি ৩ লঞ্চ করেছে, "ডিপ থিংক" এবং স্বয়ংক্রিয় এজেন্টের যুগের সূচনা

লেখক: Veronika Radoslavskaya

গুগল জেমিনি 3 চালু করেছে

জেনারেটিভ এআই-এর (Generative AI) উত্থানের দুই বছর পর, গুগল আনুষ্ঠানিকভাবে জেমিনি ৩ (Gemini 3) প্রকাশ করেছে। এটি এমন একটি মডেল যা কেবল টেক্সট অনুমান করা সাধারণ চ্যাটবট থেকে সরে এসে এমন এআই এজেন্ট তৈরির দাবি করে যা যুক্তি দিয়ে ভাবতে, পরিকল্পনা করতে এবং কাজ করতে পারে। এই রিলিজে দুটি প্রধান স্তর রয়েছে: 'জেমিনি ৩ প্রো', যা এখনই পাওয়া যাচ্ছে, এবং আরও শক্তিশালী 'জেমিনি ৩ ডিপ থিংক' (Deep Think) মোড, যা উত্তর দেওয়ার আগে "চিন্তাভাবনা" করে জটিল সমস্যার সমাধানের জন্য ডিজাইন করা হয়েছে।

এই প্রজন্মের প্রধান বৈশিষ্ট্য হলো "মেকানিস্টিক রিজনিং" বা যান্ত্রিক যুক্তির ওপর গুরুত্ব দেওয়া। জেমিনি ৩ প্রো এখনই অত্যাধুনিক যুক্তি ক্ষমতা প্রদর্শন করছে, কঠিন GPQA ডায়মন্ড বেঞ্চমার্কে ৯১.৯% এবং হিউম্যানিটিজ লাস্ট এক্সাম (HLE)-এ কোনো টুল ব্যবহার ছাড়াই ৩৭.৫% স্কোর করেছে। এই সক্ষমতা মডেলটিকে বিজ্ঞান ও গণিতের গভীরতা এবং সূক্ষ্ম বিষয়গুলো অত্যন্ত নির্ভরযোগ্যতার সাথে বুঝতে সাহায্য করে।

নতুন 'ডিপ থিংক' মোড, যা শীঘ্রই আল্ট্রা সাবস্ক্রাইবারদের জন্য উপলব্ধ হবে, এই সীমানা আরও বাড়িয়ে দিয়েছে। সবচেয়ে জটিল এবং নতুন সমস্যা সমাধানের জন্য তৈরি এই মোডটি ARC-AGI-2-তে ৪৫.১% স্কোর করেছে—এটি এমন একটি কঠিন পরীক্ষা যা এআই-এর আগে কখনো না দেখা লজিক পাজল সমাধানের ক্ষমতা যাচাই করে। এছাড়া HLE-তে এটি ৪১.০% স্কোর করেছে। সাধারণ তথ্য পুনরুদ্ধার ও সংমিশ্রণের বাইরে গিয়ে এটি প্রকৃত সমস্যা সমাধানের জন্য তৈরি করা হয়েছে।

ডেভেলপারদের জন্য, এই লঞ্চের সাথে 'গুগল অ্যান্টিগ্র্যাভিটি' (Google Antigravity) নামে একটি নতুন প্ল্যাটফর্ম আনা হয়েছে। এটি একটি "এজেন্ট-ফার্স্ট" ডেভেলপমেন্ট পরিবেশ যা সফটওয়্যার ইঞ্জিনিয়ারদের এমন এআই এজেন্টদের সাথে কাজ করতে দেয় যাদের টার্মিনাল, ব্রাউজার এবং কোড এডিটরগুলিতে সরাসরি অ্যাক্সেস রয়েছে। কোডের একটি লাইন কেবল অটো-কমপ্লিট করার পরিবর্তে, এই এজেন্টরা জটিল সফটওয়্যার কাজগুলি স্বাধীনভাবে পরিকল্পনা, সম্পাদন এবং যাচাই করতে পারে। গুগল এটিকে "ভাইব কোডিং"-এর (vibe coding) চূড়ান্ত হাতিয়ার হিসেবে বর্ণনা করেছে—প্রোগ্রামিংয়ের এমন একটি ধরন যেখানে ডেভেলপাররা উচ্চ-স্তরের সৃজনশীল ইচ্ছার ওপর মনোযোগ দেন এবং এআই বাস্তবায়নের খুঁটিনাটি সামলায়।

গ্রাহকদের জন্য, জেমিনি ৩ তার মাল্টিমডাল ক্ষমতা এবং বিশাল ১ মিলিয়ন-টোকেন কনটেক্সট উইন্ডো ব্যবহার করে—যা ১,৫০০ পৃষ্ঠার বেশি টেক্সট বা সম্পূর্ণ ভিডিও লেকচারের সমান ডেটা প্রসেস করতে পারে। এটি একটি ব্যক্তিগত কোচ হিসেবে কাজ করতে পারে: উদাহরণস্বরূপ, মডেলটি ব্যবহারকারীর পিকলবল (pickleball) ম্যাচের ভিডিও বিশ্লেষণ করে তাদের খেলার নির্দিষ্ট ত্রুটি শনাক্ত করতে পারে এবং একটি কাস্টম প্রশিক্ষণের পরিকল্পনা তৈরি করতে পারে। শিক্ষার্থীদের জন্য, এটি একাডেমিক গবেষণাপত্র বা দীর্ঘ ভিডিও টিউটোরিয়াল পড়ে ইন্টারেক্টিভ স্টাডি গাইড যেমন ফ্ল্যাশকার্ড বা ভিজ্যুয়ালাইজেশন তৈরি করতে পারে। এটি হাতে লেখা রেসিপি পড়ে সেগুলোকে ডিজিটাল ফরম্যাটে রূপান্তর করতেও সক্ষম।

গুগল লিডারবোর্ডেও নিজেদের আধিপত্যের দাবি করেছে। জেমিনি ৩ প্রো ইতিমধ্যেই LMArena-তে শীর্ষস্থান দখল করেছে, যা একটি ক্রাউডসোর্সড বেঞ্চমার্কিং সাইট যেখানে ব্যবহারকারীরা অন্ধভাবে এআই মডেলগুলিকে রেট দেন। এখানে এটি ১৫০১ ইলো (Elo) স্কোর অর্জন করেছে। মডেলটির শীর্ষে ওঠার এই সাফল্য তার পূর্বসূরি জেমিনি ২.৫ প্রো-এর উত্তরাধিকার বজায় রেখেছে, যা আগে এই প্রতিযোগিতামূলক র‍্যাঙ্কিংয়ে ছিল।

মডেলটি বর্তমানে গুগলের ইকোসিস্টেম জুড়ে চালু করা হচ্ছে, যার মধ্যে রয়েছে জেমিনি অ্যাপ, ভার্টেক্স এআই (Vertex AI) এবং গুগল সার্চের একটি নতুন "এআই মোড" যা তাৎক্ষণিকভাবে ইন্টারেক্টিভ সিমুলেশন তৈরি করে। যদিও "ডিপ থিংক" মোডটি চূড়ান্ত নিরাপত্তা পরীক্ষার জন্য আটকে রাখা হয়েছে, মূল জেমিনি ৩ প্রো মডেলটি আজ থেকেই লাইভ হয়েছে, যা ইঙ্গিত দেয় যে গুগল লক্ষ লক্ষ মানুষের হাতে "এজেন্টিক" (agentic) বা কর্মক্ষম এআই তুলে দিতে প্রস্তুত।

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।