OpenAI উন্মোচন করলো জিপিটি-৫.২: পেশাদার কাজের জন্য ত্রিমুখী স্থাপত্য

লেখক: Veronika Radoslavskaya

OpenAI আনুষ্ঠানিকভাবে ঘোষণা করেছে তাদের নতুন মডেল সিরিজ, জিপিটি-৫.২, যা ২০২২ সালের ১১ই ডিসেম্বর বাজারে আসে। এই মডেলটি বিশেষভাবে পেশাদার জ্ঞানভিত্তিক কাজ এবং স্বয়ংক্রিয় এজেন্ট অ্যাপ্লিকেশনগুলির জন্য তৈরি করা হয়েছে, যেখানে একটি তিন-স্তরের মডেল ব্যবস্থা ব্যবহার করা হয়েছে। সংস্থাটির দাবি, এটি তাদের এখন পর্যন্ত তৈরি করা সবচেয়ে সক্ষম মডেল সিরিজ, যা স্প্রেডশীট তৈরি, উপস্থাপনা নির্মাণ, কোডিং, দৃষ্টি প্রক্রিয়াকরণ এবং দীর্ঘ প্রেক্ষাপট বোঝার ক্ষেত্রে উল্লেখযোগ্য উন্নতি এনেছে।

তিনটি বিশেষায়িত সংস্করণ

জিপিটি-৫.২ মডেলের কাঠামোতে তিনটি স্বতন্ত্র সংস্করণ রয়েছে: ইনস্ট্যান্ট (Instant), থিংকিং (Thinking), এবং প্রো (Pro)। প্রতিটি সংস্করণ নির্দিষ্ট জটিলতা এবং ব্যবহারের ক্ষেত্র অনুযায়ী অপটিমাইজ করা হয়েছে। ইনস্ট্যান্ট সংস্করণটি দ্রুত তথ্য অনুসন্ধান, লেখালেখি এবং অনুবাদের মতো সাধারণ কাজের জন্য গতিকে প্রাধান্য দেয়। অন্যদিকে, থিংকিং সংস্করণটি কোডিং, দীর্ঘ নথি বিশ্লেষণ, গণিত এবং পরিকল্পনা প্রণয়নের মতো জটিল ও কাঠামোগত কাজের জন্য বিশেষভাবে পারদর্শী। সর্বোচ্চ সক্ষমতার স্তর হিসেবে প্রো সংস্করণটি সবচেয়ে কঠিন সমস্যাগুলির জন্য সর্বাধিক নির্ভুলতা এবং নির্ভরযোগ্যতা নিশ্চিত করতে ডিজাইন করা হয়েছে।

বেঞ্চমার্ক পারফরম্যান্সের নতুন মানদণ্ড

জিপিটি-৫.২ থিংকিং মডেলটি এআইআইএমই (AIME) ২০২৫ প্রতিযোগিতামূলক গণিত পরীক্ষায় ১০০ শতাংশ নির্ভুলতা অর্জন করে একটি নতুন বেঞ্চমার্ক স্থাপন করেছে। এছাড়াও, জিডিপিভ্যাল (GDPval) নামক একটি মূল্যায়নে, যা ৪৪টি পেশার জ্ঞানভিত্তিক কাজ পরিমাপ করে, এই মডেলটি শিল্প বিশেষজ্ঞদের সাথে সরাসরি তুলনার ক্ষেত্রে ৭০.৯% ক্ষেত্রে জয়ী হয়েছে বা সমতা অর্জন করেছে। এটি প্রথমবার কোনো ওপেনএআই মডেলকে অর্থনৈতিকভাবে মূল্যবান কাজগুলিতে বিশেষজ্ঞ স্তরের পারফরম্যান্স অর্জন করতে দেখাল। ওপেনএআই-এর নিজস্ব বেঞ্চমার্ক চার্ট অনুযায়ী, জিপিটি-৫.২ থিংকিং এসডব্লিউই-বেঞ্চ প্রো (SWE-Bench Pro) থেকে শুরু করে জিপি কিউ এ ডায়মন্ড (GPQA Diamond) এবং এআরসি-এজিআই (ARC-AGI) স্যুট পর্যন্ত প্রায় প্রতিটি যুক্তিভিত্তিক পরীক্ষায় জেমিনি ৩ (Gemini 3) এবং অ্যানথ্রপিকের ক্লড ওপাস ৪.৫ (Claude Opus 4.5)-কে ছাড়িয়ে গেছে।

কোডিং এবং সফটওয়্যার প্রকৌশলে অগ্রগতি

বাস্তব-জগতের সফটওয়্যার প্রকৌশল মূল্যায়নের জন্য তৈরি এসডব্লিউই-বেঞ্চ প্রো পরীক্ষায়, যেখানে একাধিক প্রোগ্রামিং ভাষা পরীক্ষা করা হয়, জিপিটি-৫.২ থিংকিং ৫৫.৬% স্কোর করেছে, যা জিপিটি-৫.১ এর ৫০.৮% স্কোরের চেয়ে বেশি। মডেলটি এসডব্লিউই-বেঞ্চ ভেরিফায়েড (SWE-bench Verified)-এও ৮০% স্কোর অর্জন করেছে। উইন্ডসার্ফ (Windsurf) এবং চার্লি কোড (CharlieCode)-এর মতো কোডিং স্টার্টআপগুলি জানিয়েছে যে তারা জটিল বহু-ধাপের কর্মপ্রবাহে অত্যাধুনিক এজেন্ট কোডিং পারফরম্যান্স এবং পরিমাপযোগ্য উন্নতি লক্ষ্য করছে।

নির্ভরযোগ্যতা এবং প্রেক্ষাপট পরিচালনা

জিপিটি-৫.২ থিংকিং মডেলের প্রতিক্রিয়াগুলিতে জিপিটি-৫.১ এর তুলনায় ৩০ শতাংশ কম ত্রুটি পরিলক্ষিত হয়েছে, যা দৈনন্দিন সিদ্ধান্ত গ্রহণ, গবেষণা এবং লেখার জন্য মডেলটিকে আরও বেশি নির্ভরযোগ্য করে তুলেছে। এই মডেলটি শত শত হাজার টোকেন পর্যন্ত বিস্তৃত প্রেক্ষাপট উইন্ডো সমর্থন করে এবং বহু-রাউন্ড সহ-উল্লেখ রেজোলিউশন (co-reference resolution) কাজগুলিতে প্রায় নিখুঁত নির্ভুলতা দেখিয়েছে। দৃষ্টিশক্তির সক্ষমতাও উল্লেখযোগ্যভাবে উন্নত হয়েছে; চার্ট ব্যাখ্যা এবং সফটওয়্যার ইন্টারফেস বোঝার বেঞ্চমার্কগুলিতে ত্রুটির হার প্রায় অর্ধেক কমে এসেছে।

কৌশলগত পরিপ্রেক্ষিত

এই নতুন মডেলের প্রকাশ এমন এক সময়ে এলো যখন গুগল-এর জেমিনি ৩ মডেলের সাথে প্রতিযোগিতা তীব্র হচ্ছে, যা বর্তমানে কোডিং ছাড়া বেশিরভাগ বেঞ্চমার্কে এলএমএরেনা (LMArena)-এর লিডারবোর্ডে শীর্ষে রয়েছে। এই মাসের শুরুর দিকে, সিইও স্যাম অল্টম্যান কর্মীদের কাছে একটি অভ্যন্তরীণ 'কোড রেড' মেমো প্রকাশ করেছিলেন বলে জানা যায়, যেখানে চ্যাটজিপিটি ট্র্যাফিক হ্রাস এবং গুগলের কাছে ভোক্তা বাজার হারানোর উদ্বেগ প্রকাশ করা হয়েছিল। সেই মেমোতে প্রতিশ্রুতি স্থগিত করে বিজ্ঞাপন চালু করার পরিবর্তে চ্যাটজিপিটি অভিজ্ঞতা উন্নত করার দিকে অগ্রাধিকার স্থানান্তরের কথা বলা হয়েছিল।

প্রাপ্তি ও নিরাপত্তা

জিপিটি-৫.২ মডেলটি বর্তমানে পেইড চ্যাটজিপিটি গ্রাহকদের (প্লাস, প্রো, বিজনেস, এন্টারপ্রাইজ) জন্য ধাপে ধাপে চালু করা হচ্ছে এবং এটি এপিআই (API)-এর মাধ্যমে তিনটি সংস্করণেই তাৎক্ষণিকভাবে উপলব্ধ। ওপেনএআই মানসিক স্বাস্থ্য সংক্রান্ত ব্যবহার এবং কিশোর-কিশোরীদের জন্য বয়স যাচাইকরণের বিষয়ে নতুন নিরাপত্তা ব্যবস্থা ঘোষণা করেছে, যদিও লঞ্চ ব্রিফিংয়ে এগুলির ওপর বিশেষ জোর দেওয়া হয়নি।

23 দৃশ্য

উৎসসমূহ

  • OpenAI Blog

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।