২০২৬ সালের জানুয়ারির শেষের দিকে চীনের কৃত্রিম বুদ্ধিমত্তা বা এআই খাতে এক বৈপ্লবিক পরিবর্তন লক্ষ্য করা গেছে। আলিবাবা ক্লাউড তাদের 'কিউওয়েন৩-ম্যাক্স-থিংকিং' (Qwen3-Max-Thinking) এবং মুনশট এআই তাদের 'কিমি কে২.৫' (Kimi K2.5) নামক দুটি শক্তিশালী ফ্ল্যাগশিপ মডেল একই সাথে বাজারে এনেছে। এই নতুন সংস্করণগুলো মূলত "রিজনিং-ফার্স্ট" বা যুক্তি-নির্ভর আর্কিটেকচারের দিকে এআই শিল্পের ঝোঁককে আরও স্পষ্ট করে তুলেছে, যা জটিল লজিক এবং স্বয়ংক্রিয় কাজ সম্পাদনে অত্যন্ত দক্ষ।
🥝 Meet Kimi K2.5, Open-Source Visual Agentic Intelligence. 🔹 Global SOTA on Agentic Benchmarks: HLE full set (50.2%), BrowseComp (74.9%) 🔹 Open-source SOTA on Vision and Coding: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Verified (76.8%) 🔹 Code with Taste: turn chats,
আলিবাবা ক্লাউড ২০২৬ সালের ২৬ জানুয়ারি তাদের কিউওয়েন৩-ম্যাক্স-থিংকিং মডেলটি অবমুক্ত করে। এক ট্রিলিয়নেরও বেশি প্যারামিটার সমৃদ্ধ এই বিশাল মডেলটি মূলত বহুমুখী লজিক্যাল সিন্থেসিস এবং উন্নত প্রযুক্তিগত সমস্যা সমাধানের জন্য তৈরি করা হয়েছে। এটি এমনভাবে ডিজাইন করা হয়েছে যাতে এটি মানুষের মতো ধাপে ধাপে চিন্তা করে যেকোনো জটিল সমস্যার সমাধান দিতে পারে।
- অ্যাডাপ্টিভ টুল ইউজ: এই মডেলটির অন্যতম প্রধান বৈশিষ্ট্য হলো এর অ্যাডাপ্টিভ টুল ব্যবহারের ক্ষমতা। এর মাধ্যমে এআই নিজেই সিদ্ধান্ত নিতে পারে যে কোনো নির্দিষ্ট তথ্যের সত্যতা যাচাই বা গণনার জন্য সার্চ, মেমোরি বা কোড ইন্টারপ্রেটারের মতো বাহ্যিক টুলগুলোর মধ্যে কোনটি ব্যবহার করা প্রয়োজন। ব্যবহারকারীর প্রশ্নের ওপর ভিত্তি করে এটি সম্পূর্ণ স্বাধীনভাবে এই প্রক্রিয়াটি পরিচালনা করে।
- টেস্ট-টাইম স্কেলিং (TTS): কিউওয়েন৩-ম্যাক্স-থিংকিং মডেলে ইনফারেন্স-টাইম কম্পিউট স্কেলিং প্রযুক্তি ব্যবহার করা হয়েছে, যা মডেলটিকে কঠিন সমস্যাগুলো নিয়ে আরও গভীরভাবে "চিন্তা" করার সুযোগ দেয়। এই বিশেষ কৌশলের ফলে এটি এরিনা-হার্ড ভি২ (Arena-Hard v2) বেঞ্চমার্কে ৯০.২ স্কোর অর্জন করতে সক্ষম হয়েছে।
- বেঞ্চমার্ক পারফরম্যান্স: বৈজ্ঞানিক কম্পিউটিং, গাণিতিক লজিক এবং জটিল কোডিং টাস্কের ক্ষেত্রে এই মডেলটি অসাধারণ দক্ষতা প্রদর্শন করেছে, যা বিভিন্ন রিজনিং বেঞ্চমার্কে এর উচ্চ কার্যকারিতা প্রমাণ করে।
অন্যদিকে, আলিবাবা গ্রুপের সমর্থনপুষ্ট মুনশট এআই ২০২৬ সালের ২৭ জানুয়ারি তাদের 'কিমি কে২.৫' মডেলটি উন্মোচন করে। এটি একটি ওপেন-সোর্স এবং নেটিভলি মাল্টিমোডাল এজেন্টিক মডেল, যা মূলত বৃহৎ পরিসরে ডেটা প্রসেসিং এবং বিভিন্ন কাজের সমন্বয় সাধনের জন্য অপ্টিমাইজ করা হয়েছে। ১৫ ট্রিলিয়ন মিশ্র ভিজ্যুয়াল এবং টেক্সট টোকেনের এক বিশাল ডেটাসেটের ওপর ভিত্তি করে একে প্রশিক্ষণ দেওয়া হয়েছে।
- মিক্সচার-অফ-এক্সপার্টস (MoE) আর্কিটেকচার: কিমি কে২.৫ মডেলটি এমওই আর্কিটেকচারের ওপর ভিত্তি করে তৈরি। যদিও এর মোট সক্ষমতা এক ট্রিলিয়ন প্যারামিটার, তবে কাজের সময় এটি মাত্র ৩২ বিলিয়ন প্যারামিটার সক্রিয় রাখে, যা এর কার্যকারিতা বহুগুণ বাড়িয়ে দেয়।
- এজেন্ট সোয়ার্ম মোড: এই মডেলটির সবচেয়ে চমকপ্রদ দিক হলো এর 'এজেন্ট ক্লাস্টার' ক্ষমতা। এই ফিচারের মাধ্যমে এটি একটি একক প্রকল্পের জন্য ১০০টি পর্যন্ত বিশেষায়িত সাব-এজেন্টকে একসাথে পরিচালনা করতে পারে। কোনো পূর্ব-নির্ধারিত কর্মপ্রবাহ বা মানুষের হস্তক্ষেপ ছাড়াই এই সিস্টেমটি স্বয়ংক্রিয়ভাবে জটিল সমস্যার সমাধান খুঁজে বের করতে সক্ষম।
- এজেন্টিক দক্ষতা: এন্টারপ্রাইজ-লেভেল অটোমেশনের ক্ষেত্রে এটি এইচএলই (HLE) এবং ব্রাউজকম্প (BrowseComp) বেঞ্চমার্কে উচ্চ নম্বর অর্জন করেছে। এটি মূলত বহু-ধাপ বিশিষ্ট পরিকল্পনা এবং ব্রাউজার-ভিত্তিক গবেষণার ওপর বিশেষ গুরুত্ব প্রদান করে।
যদিও আলিবাবা এবং মুনশট—উভয় প্রতিষ্ঠানের মডেলই ট্রিলিয়ন-প্যারামিটার ফাউন্ডেশনের ওপর ভিত্তি করে তৈরি, তবুও তাদের প্রয়োগের ক্ষেত্রে কিছুটা ভিন্নতা রয়েছে। আলিবাবার কিউওয়েন৩-ম্যাক্স-থিংকিং যেখানে গভীর ও পুনরাবৃত্তিমূলক যুক্তি এবং স্বয়ংক্রিয় টুল নির্বাচনের ওপর জোর দেয়, সেখানে মুনশটের কিমি কে২.৫ মাল্টিমোডাল এজেন্টিক সমন্বয় এবং বৃহৎ আকারের স্বয়ংক্রিয় কর্মপ্রবাহের ওপর বেশি গুরুত্বারোপ করে।



