
ओपनएआई के जीपीटी-5.2 थिंकिंग ने जापानी प्रवेश परीक्षा में मानव औसत को पीछे छोड़ा
द्वारा संपादित: Veronika Radoslavskaya

जापान में 17 और 18 जनवरी, 2026 को आयोजित कॉमन टेस्ट फॉर यूनिवर्सिटी एडमिशन्स के प्रश्नों पर नवीनतम कृत्रिम बुद्धिमत्ता (एआई) मॉडलों का परीक्षण किया गया, जिसके परिणाम 20 जनवरी, 2026 को सामने आए। यह महत्वपूर्ण प्रयोग निक्केई समाचार पत्र और जापानी एआई स्टार्टअप लाइफप्रॉम्प्ट द्वारा संयुक्त रूप से संचालित किया गया था, जिसमें ओपनएआई और गूगल जैसी प्रमुख प्रौद्योगिकी कंपनियों के मॉडलों ने भाग लिया। इस मूल्यांकन ने बौद्धिक श्रम और शैक्षणिक मूल्यांकन के क्षेत्र में एआई की तीव्र प्रगति को उजागर किया है, जिसके भविष्य के तकनीकी विकास के लिए दूरगामी निहितार्थ हैं।
ओपनएआई द्वारा विकसित जीपीटी-5.2 थिंकिंग मॉडल ने 15 प्रमुख विषयों में 100 में से 96.9 का समग्र स्कोर दर्ज किया, जो मानव औसत अनुमानित स्कोर 58.1 से काफी अधिक है। विशेष रूप से, इस मॉडल ने परीक्षण किए गए 15 विषयों में से नौ में पूर्ण अंक हासिल किए, जो मात्रात्मक विषयों में इसकी असाधारण क्षमता को दर्शाता है। इसके विपरीत, गूगल के जेमिनी 3.0 प्रो ने 91.4 का समग्र स्कोर प्राप्त किया, जो एआई क्षमताओं के बीच प्रतिस्पर्धा को रेखांकित करता है। यह प्रदर्शन ओपनएआई के पिछले वर्षों के परिणामों से एक उल्लेखनीय प्रगति है, क्योंकि 2024 में उनके मॉडल का औसत स्कोर 66 था और 2025 में यह बढ़कर 91 हो गया था।
विश्लेषण से पता चला कि एआई मॉडल गणित, भौतिकी, रसायन विज्ञान और जीव विज्ञान जैसे मात्रात्मक क्षेत्रों में उत्कृष्ट थे, जहाँ संरचित डेटा और तार्किक तर्क की आवश्यकता होती है। हालाँकि, उन्हें मानविकी और स्थानिक तर्क से संबंधित विषयों में कठिनाई का सामना करना पड़ा, विशेष रूप से विश्व मानचित्रों की व्याख्या करने वाले प्रश्नों पर त्रुटियाँ हुईं, जो जटिल ग्राफिकल जानकारी को पहचानने में वर्तमान एआई की सीमाओं को इंगित करता है। लाइफप्रॉम्प्ट के प्रमुख सातोशी एंडो ने उल्लेख किया कि गणित में पूर्ण अंक प्राप्त करने के बावजूद, जापानी भाषा परीक्षण में मॉडल अभी भी जापानी में लिखी गई जानकारी को पर्याप्त रूप से व्यवस्थित नहीं कर पा रहे हैं।
यह प्रयोग जापान के राष्ट्रीय सूचना विज्ञान संस्थान (NII) की पुरानी महत्वाकांक्षाओं की पृष्ठभूमि में देखा जा सकता है, जैसे कि 'टो-रोबो-कुन' परियोजना, जिसका उद्देश्य 2015 में ही विश्वविद्यालय प्रवेश परीक्षा को बेंचमार्क के रूप में उपयोग करके एआई की बौद्धिक श्रम क्षमताओं का आकलन करना था। टो-रोबो-कुन परियोजना के निदेशक नोरिको अराई ने पहले बताया था कि इस तरह के परीक्षणों का वास्तविक उद्देश्य समाज को यह प्रदर्शित करना है कि कृत्रिम बुद्धिमत्ता क्या कर सकती है और क्या नहीं, और यह सुझाव देना है कि एआई किस हद तक श्वेत-कॉलर कार्य संभाल सकता है।
यह उच्च प्रदर्शन शैक्षणिक प्रणालियों के लिए एक महत्वपूर्ण मोड़ प्रस्तुत करता है, क्योंकि लगभग 500,000 छात्रों ने इस दो दिवसीय परीक्षा के लिए आवेदन किया था, जिसके परिणामों का उपयोग 813 विश्वविद्यालयों द्वारा स्क्रीनिंग प्रक्रियाओं के लिए किया जाएगा। एआई मॉडल, जो बिना खोज इंजन वेबसाइटों तक पहुँच के केवल अपने संग्रहीत डेटा का उपयोग करके उत्तर दे रहे थे, ने मानव परीक्षार्थियों के औसत स्कोर को काफी पीछे छोड़ दिया है। यह घटनाक्रम शैक्षणिक मूल्यांकन के भविष्य पर सवाल उठाता है और इस बात पर जोर देता है कि मानव शिक्षा को उन कौशलों पर ध्यान केंद्रित करने की आवश्यकता है जिनमें मनुष्य एआई से बेहतर प्रदर्शन कर सकते हैं।
30 दृश्य
स्रोतों
AGERPRES
China.org.cn
Xinhua
Nippon.com
OfficeChai
EvoLink.AI
इस विषय पर और अधिक समाचार पढ़ें:
anthropic just made switching to claude stupidly easy they launched a "import memory" feature that lets you copy your entire memory from chatgpt (or gemini, whatever) into claude here's how it works (takes like 60 seconds): 1. go to claude . com /import-memory 2. copy the
क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।


