ओपनएआई के जीपीटी-5.2 थिंकिंग ने जापानी प्रवेश परीक्षा में मानव औसत को पीछे छोड़ा
द्वारा संपादित: Veronika Radoslavskaya
जापान में 17 और 18 जनवरी, 2026 को आयोजित कॉमन टेस्ट फॉर यूनिवर्सिटी एडमिशन्स के प्रश्नों पर नवीनतम कृत्रिम बुद्धिमत्ता (एआई) मॉडलों का परीक्षण किया गया, जिसके परिणाम 20 जनवरी, 2026 को सामने आए। यह महत्वपूर्ण प्रयोग निक्केई समाचार पत्र और जापानी एआई स्टार्टअप लाइफप्रॉम्प्ट द्वारा संयुक्त रूप से संचालित किया गया था, जिसमें ओपनएआई और गूगल जैसी प्रमुख प्रौद्योगिकी कंपनियों के मॉडलों ने भाग लिया। इस मूल्यांकन ने बौद्धिक श्रम और शैक्षणिक मूल्यांकन के क्षेत्र में एआई की तीव्र प्रगति को उजागर किया है, जिसके भविष्य के तकनीकी विकास के लिए दूरगामी निहितार्थ हैं।
ओपनएआई द्वारा विकसित जीपीटी-5.2 थिंकिंग मॉडल ने 15 प्रमुख विषयों में 100 में से 96.9 का समग्र स्कोर दर्ज किया, जो मानव औसत अनुमानित स्कोर 58.1 से काफी अधिक है। विशेष रूप से, इस मॉडल ने परीक्षण किए गए 15 विषयों में से नौ में पूर्ण अंक हासिल किए, जो मात्रात्मक विषयों में इसकी असाधारण क्षमता को दर्शाता है। इसके विपरीत, गूगल के जेमिनी 3.0 प्रो ने 91.4 का समग्र स्कोर प्राप्त किया, जो एआई क्षमताओं के बीच प्रतिस्पर्धा को रेखांकित करता है। यह प्रदर्शन ओपनएआई के पिछले वर्षों के परिणामों से एक उल्लेखनीय प्रगति है, क्योंकि 2024 में उनके मॉडल का औसत स्कोर 66 था और 2025 में यह बढ़कर 91 हो गया था।
विश्लेषण से पता चला कि एआई मॉडल गणित, भौतिकी, रसायन विज्ञान और जीव विज्ञान जैसे मात्रात्मक क्षेत्रों में उत्कृष्ट थे, जहाँ संरचित डेटा और तार्किक तर्क की आवश्यकता होती है। हालाँकि, उन्हें मानविकी और स्थानिक तर्क से संबंधित विषयों में कठिनाई का सामना करना पड़ा, विशेष रूप से विश्व मानचित्रों की व्याख्या करने वाले प्रश्नों पर त्रुटियाँ हुईं, जो जटिल ग्राफिकल जानकारी को पहचानने में वर्तमान एआई की सीमाओं को इंगित करता है। लाइफप्रॉम्प्ट के प्रमुख सातोशी एंडो ने उल्लेख किया कि गणित में पूर्ण अंक प्राप्त करने के बावजूद, जापानी भाषा परीक्षण में मॉडल अभी भी जापानी में लिखी गई जानकारी को पर्याप्त रूप से व्यवस्थित नहीं कर पा रहे हैं।
यह प्रयोग जापान के राष्ट्रीय सूचना विज्ञान संस्थान (NII) की पुरानी महत्वाकांक्षाओं की पृष्ठभूमि में देखा जा सकता है, जैसे कि 'टो-रोबो-कुन' परियोजना, जिसका उद्देश्य 2015 में ही विश्वविद्यालय प्रवेश परीक्षा को बेंचमार्क के रूप में उपयोग करके एआई की बौद्धिक श्रम क्षमताओं का आकलन करना था। टो-रोबो-कुन परियोजना के निदेशक नोरिको अराई ने पहले बताया था कि इस तरह के परीक्षणों का वास्तविक उद्देश्य समाज को यह प्रदर्शित करना है कि कृत्रिम बुद्धिमत्ता क्या कर सकती है और क्या नहीं, और यह सुझाव देना है कि एआई किस हद तक श्वेत-कॉलर कार्य संभाल सकता है।
यह उच्च प्रदर्शन शैक्षणिक प्रणालियों के लिए एक महत्वपूर्ण मोड़ प्रस्तुत करता है, क्योंकि लगभग 500,000 छात्रों ने इस दो दिवसीय परीक्षा के लिए आवेदन किया था, जिसके परिणामों का उपयोग 813 विश्वविद्यालयों द्वारा स्क्रीनिंग प्रक्रियाओं के लिए किया जाएगा। एआई मॉडल, जो बिना खोज इंजन वेबसाइटों तक पहुँच के केवल अपने संग्रहीत डेटा का उपयोग करके उत्तर दे रहे थे, ने मानव परीक्षार्थियों के औसत स्कोर को काफी पीछे छोड़ दिया है। यह घटनाक्रम शैक्षणिक मूल्यांकन के भविष्य पर सवाल उठाता है और इस बात पर जोर देता है कि मानव शिक्षा को उन कौशलों पर ध्यान केंद्रित करने की आवश्यकता है जिनमें मनुष्य एआई से बेहतर प्रदर्शन कर सकते हैं।
3 दृश्य
स्रोतों
AGERPRES
China.org.cn
Xinhua
Nippon.com
OfficeChai
EvoLink.AI
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
