xAI গ্রক ৪.১ চালু করল: কণ্ঠস্বর ও ভিজ্যুয়াল সৃজনশীলতার জন্য এক "আরও মানবিক" মস্তিষ্ক

লেখক: Veronika Radoslavskaya

xAI Grok 4.1 চালু করেছে

ইলন মাস্কের কৃত্রিম বুদ্ধিমত্তা সংস্থা xAI আনুষ্ঠানিকভাবে **গ্রক ৪.১** (Grok 4.1) প্রকাশ করেছে। এটি একটি বিশাল আপডেট যা এআই কীভাবে মানুষের সাথে যোগাযোগ করে তার মৌলিক পরিবর্তন এনেছে। শিল্প যখন মূলত কাঁচা গণনা শক্তির উপর মনোযোগ দিচ্ছিল, তখন গ্রক ৪.১ "আবেগিক বুদ্ধিমত্তা" এবং নির্ভরযোগ্যতাকে অগ্রাধিকার দিয়ে নিজেকে আলাদা করেছে। এই নতুন মডেলটি xAI-এর ভয়েস ক্ষমতাকে উন্নত করার এবং এর ক্রমবর্ধমান ভিজ্যুয়াল সরঞ্জামগুলিকে চালিত করার জন্য একটি গুরুত্বপূর্ণ "যুক্তি ইঞ্জিন" (reasoning engine) হিসাবে কাজ করে।

**"মানবিক" উপাদান: ভয়েস মোডের উন্নতি** গ্রক ৪.১-এর সবচেয়ে উল্লেখযোগ্য উন্নতি হলো সূক্ষ্মতা, ব্যঙ্গ এবং আবেগিক উপ-পাঠ্য বোঝার ক্ষমতা। এআই-এর সহানুভূতি পরিমাপকারী **ইকিউ-বেঞ্চ৩ (EQ-Bench3) মূল্যায়নে**, নতুন মডেলটি **১,৫৮৬** স্কোর করেছে, যা পূর্ববর্তী সংস্করণগুলির তুলনায় একটি উল্লেখযোগ্য অগ্রগতি প্রদর্শন করে। এই স্কোর প্রমাণ করে যে মডেলটি এখন মানুষের আবেগীয় জটিলতা বুঝতে সক্ষম।

এই আপগ্রেডটি **ভয়েস মোড**-এর জন্য তাৎক্ষণিক প্রভাব ফেলেছে। কণ্ঠস্বরের মাধ্যমে এআই-এর সাথে যোগাযোগকারী ব্যবহারকারীরা রোবোটিক প্রশ্ন-উত্তর মেশিনের পরিবর্তে এটিকে একজন কথোপকথন অংশীদার হিসেবে দেখতে পাবেন, যা যেন "ঘরের মেজাজ পড়তে পারে"। যেহেতু মডেলটি এখন সূক্ষ্ম উদ্দেশ্য এবং স্বর বুঝতে পারে, তাই ভয়েস ইন্টারঅ্যাকশনগুলি আরও সাবলীল ও স্বাভাবিক হয়ে উঠেছে এবং ব্যবহারকারীর অভিজ্ঞতা বহুগুণে উন্নত হয়েছে।

**ছবি ও ভিডিওর জন্য "সৃজনশীল পরিচালক"** যদিও গ্রক ৪.১ মূলত পাঠ্য-ভিত্তিক বুদ্ধিমত্তা, তবুও এটি xAI-এর মাল্টিমোডাল উচ্চাকাঙ্ক্ষায় একটি গুরুত্বপূর্ণ ভূমিকা পালন করে। এই মডেলটি একটি "সৃজনশীল পরিচালক" হিসাবে কাজ করে, যা ব্যবহারকারীর অনুরোধগুলি ব্যাখ্যা করতে এবং বাহ্যিক ভিজ্যুয়াল সরঞ্জামগুলির জন্য অত্যন্ত বিস্তারিত প্রম্পট লিখতে এর রেকর্ড-ব্রেকিং সৃজনশীল লেখার দক্ষতা (স্কোর **১,৭০৮ ইলো**) ব্যবহার করে।

বর্তমানে, এটি প্ল্যাটফর্মের ইমেজ জেনারেশন (ফ্লাক্সের মাধ্যমে) এবং নতুন উদীয়মান **ছবি থেকে ভিডিও অ্যানিমেশন** বৈশিষ্ট্যগুলিকে শক্তি জোগাচ্ছে। যদিও সম্পূর্ণ টেক্সট-টু-ভিডিও জেনারেশন এখনও অভ্যন্তরীণ প্রিভিউতে রয়েছে, গ্রক ৪.১-এর উন্নত যুক্তি ব্যবহারকারীদের স্থির ছবিগুলিকে আরও নির্ভুলতার সাথে ছোট অ্যানিমেটেড ক্লিপে পরিণত করার সুযোগ দেয়, কার্যকরভাবে পাঠ্য এবং চলমান ভিজ্যুয়ালের মধ্যে ব্যবধান দূর করে।

**বিভ্রমের (Hallucinations) ব্যাপক হ্রাস** সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো, মডেলটি উল্লেখযোগ্যভাবে আরও সত্যবাদী হয়ে উঠেছে। xAI উন্নত প্রশিক্ষণ কৌশল ব্যবহার করে বাস্তব-জগতের প্রশ্নগুলিতে বিভ্রমের হার (তথ্য উদ্ভাবন) **১২.০৯% থেকে মাত্র ৪.২২%**-এ নামিয়ে এনেছে। কঠোর **ফ্যাক্টস্কোর (FActScore) বেঞ্চমার্কে**, ত্রুটির হার প্রায় দুই-তৃতীয়াংশ কমে ৩%-এর নিচে নেমে এসেছে, যা জেনারেটিভ এআই নিয়ে ব্যবহারকারীদের সবচেয়ে বড় অভিযোগগুলির মধ্যে একটির সমাধান করেছে।

**বাজারের আধিপত্য** এই অভ্যন্তরীণ মেট্রিকগুলি জনমতের দ্বারা সমর্থিত। **এলএমএরিনা (LMArena)-এর "টেক্সট এরিনা"**—একটি অন্ধ ক্রাউডসোর্সড লিডারবোর্ডে—গ্রক ৪.১ বিশ্বব্যাপী **এক নম্বর স্থান** অর্জন করেছে, যা এর নিকটতম প্রতিদ্বন্দ্বীর চেয়ে আরামে **৩১ পয়েন্ট** এগিয়ে রয়েছে। এই শক্তিশালী পারফরম্যান্স এআই জগতে xAI-এর অবস্থানকে আরও দৃঢ় করেছে। মডেলটি বর্তমানে এক্স প্ল্যাটফর্ম এবং মোবাইল অ্যাপগুলিতে ব্যবহারকারীদের জন্য চালু করা হচ্ছে।

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।