ওপেনএআই-এর GDPval বেঞ্চমার্ক: এআই-এর অর্থনৈতিক প্রভাব পরিমাপের নতুন দিগন্ত

06:13, 26 সেপ্টেম্বর

সম্পাদনা করেছেন: Veronika Radoslavskaya

On GDPval, expert graders compared outputs from leading models to human expert work. Claude Opus 4.1 delivered the strongest results, with just under half of its outputs rated as good as or better than expert work. Just as striking is the pace of progress: OpenAI’s frontier

4:24 PM · Sep 25, 2025

634

Read 13 replies

Watch on X

কৃত্রিম বুদ্ধিমত্তার (AI) জগতে একটি যুগান্তকারী পদক্ষেপ হিসেবে, ওপেনএআই সম্প্রতি GDPval নামে একটি নতুন বেঞ্চমার্ক চালু করেছে। এই উদ্ভাবনী পরীক্ষাটি বিভিন্ন শিল্পে AI মডেলগুলির অর্থনৈতিক মূল্য এবং কার্যকারিতা মূল্যায়নের জন্য ডিজাইন করা হয়েছে। ২৫ সেপ্টেম্বর, ২০২৫-এ ঘোষিত এই উদ্যোগটি AI-এর বাস্তব-বিশ্বের কর্মক্ষমতা পরিমাপের পদ্ধতিতে একটি নতুন মাত্রা যোগ করেছে।

GDPval বেঞ্চমার্কটি স্বাস্থ্যসেবা, অর্থ, উৎপাদন এবং সরকারি খাতের মতো নয়টি প্রধান শিল্প জুড়ে ৪৪টি পেশার উপর দৃষ্টি নিবদ্ধ করে। এর মধ্যে রয়েছে সফটওয়্যার ইঞ্জিনিয়ার, নার্স এবং সাংবাদিকদের মতো পেশাদাররা। এই পরীক্ষার প্রাথমিক পর্যায়ে, OpenAI বিষয় বিশেষজ্ঞদের আমন্ত্রণ জানায় তাদের কাজের সাথে AI-উত্পন্ন প্রতিবেদনগুলির তুলনা করতে এবং কোনটি শ্রেষ্ঠ তা নির্বাচন করতে। ফলাফলে দেখা গেছে যে GPT-5 মডেলটি ৪০.৬% ক্ষেত্রে শিল্প বিশেষজ্ঞদের তুলনায় উন্নত বা সমকক্ষ ছিল। তবে, অ্যানথ্রপিকের ক্লোড ওপাস ৪.১ মডেলটি নির্দিষ্ট কিছু মেট্রিক্সে ৪৯% কার্যকারিতা দেখিয়ে GPT-5 কে ছাড়িয়ে গেছে। OpenAI ব্যাখ্যা করেছে যে ক্লোডের উচ্চ স্কোর আংশিকভাবে এর আরও আকর্ষণীয় চার্ট তৈরির প্রবণতার কারণে হতে পারে, যা কেবল উন্নত কর্মক্ষমতার চেয়ে বেশি।

এই নতুন বেঞ্চমার্কটি AI মডেলগুলির সময় সাশ্রয় এবং পেশাদারদের আরও অর্থপূর্ণ কাজে মনোনিবেশ করার ক্ষমতাকে তুলে ধরে। একটি প্রতিবেদন অনুসারে, AI ২০২৯ সালের মধ্যে পেশাদারদের প্রতি সপ্তাহে গড়ে ১২ ঘন্টা পর্যন্ত সময় বাঁচাতে পারে, যা বর্তমানে প্রতি সপ্তাহে প্রায় ৪ ঘন্টা। এটি কর্মক্ষেত্রে AI-এর ক্রমবর্ধমান গুরুত্ব এবং উৎপাদনশীলতা বৃদ্ধির সম্ভাবনার উপর আলোকপাত করে। GPT-5 এর কর্মক্ষমতা GPT-4o মডেলের তুলনায় প্রায় তিনগুণ বৃদ্ধি পেয়েছে, যা AI প্রযুক্তির দ্রুত অগ্রগতির একটি স্পষ্ট ইঙ্গিত।

অর্থনৈতিক মূল্যের উপর GDPval-এর ফোকাস বিশেষভাবে তাৎপর্যপূর্ণ, কারণ শিল্পগুলি ক্রমবর্ধমানভাবে AI বিনিয়োগের উপর বাস্তব রিটার্ন খুঁজছে। OpenAI-এর চিফ ইকোনমিস্ট অ্যারন চ্যাটার্জি উল্লেখ করেছেন যে AI মডেলগুলি পেশাদারদের সময় বাঁচাতে সাহায্য করতে পারে, যা তাদের আরও গুরুত্বপূর্ণ কাজে মনোনিবেশ করার সুযোগ দেয়। এটি কেবল কর্মক্ষমতা বৃদ্ধিই নয়, খরচ-কার্যকারিতাও নির্দেশ করে। GPT-5 API কলগুলির খরচ ক্লোড ওপাস ৪.১ এর তুলনায় কম, যা এর ব্যাপক গ্রহণের জন্য একটি গুরুত্বপূর্ণ বিষয়। তবে, OpenAI স্বীকার করেছে যে বর্তমান GDPval পরীক্ষাটি কেবল প্রতিবেদন তৈরির উপর দৃষ্টি নিবদ্ধ করে এবং অনেক পেশার কাজের সম্পূর্ণ পরিধিকে অন্তর্ভুক্ত করে না। তারা ভবিষ্যতে আরও ব্যাপক পরীক্ষা তৈরি করার পরিকল্পনা করছে যা আরও বেশি শিল্প এবং ইন্টারেক্টিভ ওয়ার্কফ্লোকে অন্তর্ভুক্ত করবে। এই উন্নয়নগুলি AI-এর বাস্তব-বিশ্বের অর্থনৈতিক প্রভাবকে আরও ভালোভাবে বোঝার জন্য একটি গুরুত্বপূর্ণ পদক্ষেপ, যা ভবিষ্যতে কর্মক্ষেত্র এবং শিল্পগুলিতে আমূল পরিবর্তন আনতে পারে।

52 দৃশ্য

উৎসসমূহ

新浪财经
OpenAI发布GDPval基准测试，评估AI模型在经济价值工作中的表现
How GPT-5 compares to Claude Opus 4.1

এই বিষয়ে আরও নিবন্ধ পড়ুন:

09 এপ্রিল

এআই স্টাইল এডিটরের কারণে পাবলিসিটি রাইটস লঙ্ঘনের মামলায় পড়ল গ্রামারলি

06 এপ্রিল

মাইক্রোসফটের নিজস্ব এআই মডেল উন্মোচন: ওপেনএআই ও গুগলের সঙ্গে সরাসরি প্রতিযোগিতা

06 এপ্রিল

এসকে হাইনিক্স: মাইক্রোসফট ও গুগলের সাথে এআই ডিআরএএম সুরক্ষিত করতে বহু-বর্ষীয় সরবরাহ চুক্তি

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।