কৃত্রিম বুদ্ধিমত্তার (AI) জগতে একটি যুগান্তকারী পদক্ষেপ হিসেবে, ওপেনএআই সম্প্রতি GDPval নামে একটি নতুন বেঞ্চমার্ক চালু করেছে। এই উদ্ভাবনী পরীক্ষাটি বিভিন্ন শিল্পে AI মডেলগুলির অর্থনৈতিক মূল্য এবং কার্যকারিতা মূল্যায়নের জন্য ডিজাইন করা হয়েছে। ২৫ সেপ্টেম্বর, ২০২৫-এ ঘোষিত এই উদ্যোগটি AI-এর বাস্তব-বিশ্বের কর্মক্ষমতা পরিমাপের পদ্ধতিতে একটি নতুন মাত্রা যোগ করেছে।
GDPval বেঞ্চমার্কটি স্বাস্থ্যসেবা, অর্থ, উৎপাদন এবং সরকারি খাতের মতো নয়টি প্রধান শিল্প জুড়ে ৪৪টি পেশার উপর দৃষ্টি নিবদ্ধ করে। এর মধ্যে রয়েছে সফটওয়্যার ইঞ্জিনিয়ার, নার্স এবং সাংবাদিকদের মতো পেশাদাররা। এই পরীক্ষার প্রাথমিক পর্যায়ে, OpenAI বিষয় বিশেষজ্ঞদের আমন্ত্রণ জানায় তাদের কাজের সাথে AI-উত্পন্ন প্রতিবেদনগুলির তুলনা করতে এবং কোনটি শ্রেষ্ঠ তা নির্বাচন করতে। ফলাফলে দেখা গেছে যে GPT-5 মডেলটি ৪০.৬% ক্ষেত্রে শিল্প বিশেষজ্ঞদের তুলনায় উন্নত বা সমকক্ষ ছিল। তবে, অ্যানথ্রপিকের ক্লোড ওপাস ৪.১ মডেলটি নির্দিষ্ট কিছু মেট্রিক্সে ৪৯% কার্যকারিতা দেখিয়ে GPT-5 কে ছাড়িয়ে গেছে। OpenAI ব্যাখ্যা করেছে যে ক্লোডের উচ্চ স্কোর আংশিকভাবে এর আরও আকর্ষণীয় চার্ট তৈরির প্রবণতার কারণে হতে পারে, যা কেবল উন্নত কর্মক্ষমতার চেয়ে বেশি।
এই নতুন বেঞ্চমার্কটি AI মডেলগুলির সময় সাশ্রয় এবং পেশাদারদের আরও অর্থপূর্ণ কাজে মনোনিবেশ করার ক্ষমতাকে তুলে ধরে। একটি প্রতিবেদন অনুসারে, AI ২০২৯ সালের মধ্যে পেশাদারদের প্রতি সপ্তাহে গড়ে ১২ ঘন্টা পর্যন্ত সময় বাঁচাতে পারে, যা বর্তমানে প্রতি সপ্তাহে প্রায় ৪ ঘন্টা। এটি কর্মক্ষেত্রে AI-এর ক্রমবর্ধমান গুরুত্ব এবং উৎপাদনশীলতা বৃদ্ধির সম্ভাবনার উপর আলোকপাত করে। GPT-5 এর কর্মক্ষমতা GPT-4o মডেলের তুলনায় প্রায় তিনগুণ বৃদ্ধি পেয়েছে, যা AI প্রযুক্তির দ্রুত অগ্রগতির একটি স্পষ্ট ইঙ্গিত।
অর্থনৈতিক মূল্যের উপর GDPval-এর ফোকাস বিশেষভাবে তাৎপর্যপূর্ণ, কারণ শিল্পগুলি ক্রমবর্ধমানভাবে AI বিনিয়োগের উপর বাস্তব রিটার্ন খুঁজছে। OpenAI-এর চিফ ইকোনমিস্ট অ্যারন চ্যাটার্জি উল্লেখ করেছেন যে AI মডেলগুলি পেশাদারদের সময় বাঁচাতে সাহায্য করতে পারে, যা তাদের আরও গুরুত্বপূর্ণ কাজে মনোনিবেশ করার সুযোগ দেয়। এটি কেবল কর্মক্ষমতা বৃদ্ধিই নয়, খরচ-কার্যকারিতাও নির্দেশ করে। GPT-5 API কলগুলির খরচ ক্লোড ওপাস ৪.১ এর তুলনায় কম, যা এর ব্যাপক গ্রহণের জন্য একটি গুরুত্বপূর্ণ বিষয়। তবে, OpenAI স্বীকার করেছে যে বর্তমান GDPval পরীক্ষাটি কেবল প্রতিবেদন তৈরির উপর দৃষ্টি নিবদ্ধ করে এবং অনেক পেশার কাজের সম্পূর্ণ পরিধিকে অন্তর্ভুক্ত করে না। তারা ভবিষ্যতে আরও ব্যাপক পরীক্ষা তৈরি করার পরিকল্পনা করছে যা আরও বেশি শিল্প এবং ইন্টারেক্টিভ ওয়ার্কফ্লোকে অন্তর্ভুক্ত করবে। এই উন্নয়নগুলি AI-এর বাস্তব-বিশ্বের অর্থনৈতিক প্রভাবকে আরও ভালোভাবে বোঝার জন্য একটি গুরুত্বপূর্ণ পদক্ষেপ, যা ভবিষ্যতে কর্মক্ষেত্র এবং শিল্পগুলিতে আমূল পরিবর্তন আনতে পারে।