ओपनएआई के जीपीटी-5.2 थिंकिंग ने जापानी प्रवेश परीक्षा में मानव औसत को पीछे छोड़ा

17:41, 20 जनवरी

द्वारा संपादित: Veronika Radoslavskaya

ओपनएआई के जीपीटी-5.2 थिंकिंग ने जापानी प्रवेश परीक्षा में मानव औसत को पीछे छोड़ा-1

जापान में 17 और 18 जनवरी, 2026 को आयोजित कॉमन टेस्ट फॉर यूनिवर्सिटी एडमिशन्स के प्रश्नों पर नवीनतम कृत्रिम बुद्धिमत्ता (एआई) मॉडलों का परीक्षण किया गया, जिसके परिणाम 20 जनवरी, 2026 को सामने आए। यह महत्वपूर्ण प्रयोग निक्केई समाचार पत्र और जापानी एआई स्टार्टअप लाइफप्रॉम्प्ट द्वारा संयुक्त रूप से संचालित किया गया था, जिसमें ओपनएआई और गूगल जैसी प्रमुख प्रौद्योगिकी कंपनियों के मॉडलों ने भाग लिया। इस मूल्यांकन ने बौद्धिक श्रम और शैक्षणिक मूल्यांकन के क्षेत्र में एआई की तीव्र प्रगति को उजागर किया है, जिसके भविष्य के तकनीकी विकास के लिए दूरगामी निहितार्थ हैं।

ओपनएआई द्वारा विकसित जीपीटी-5.2 थिंकिंग मॉडल ने 15 प्रमुख विषयों में 100 में से 96.9 का समग्र स्कोर दर्ज किया, जो मानव औसत अनुमानित स्कोर 58.1 से काफी अधिक है। विशेष रूप से, इस मॉडल ने परीक्षण किए गए 15 विषयों में से नौ में पूर्ण अंक हासिल किए, जो मात्रात्मक विषयों में इसकी असाधारण क्षमता को दर्शाता है। इसके विपरीत, गूगल के जेमिनी 3.0 प्रो ने 91.4 का समग्र स्कोर प्राप्त किया, जो एआई क्षमताओं के बीच प्रतिस्पर्धा को रेखांकित करता है। यह प्रदर्शन ओपनएआई के पिछले वर्षों के परिणामों से एक उल्लेखनीय प्रगति है, क्योंकि 2024 में उनके मॉडल का औसत स्कोर 66 था और 2025 में यह बढ़कर 91 हो गया था।

विश्लेषण से पता चला कि एआई मॉडल गणित, भौतिकी, रसायन विज्ञान और जीव विज्ञान जैसे मात्रात्मक क्षेत्रों में उत्कृष्ट थे, जहाँ संरचित डेटा और तार्किक तर्क की आवश्यकता होती है। हालाँकि, उन्हें मानविकी और स्थानिक तर्क से संबंधित विषयों में कठिनाई का सामना करना पड़ा, विशेष रूप से विश्व मानचित्रों की व्याख्या करने वाले प्रश्नों पर त्रुटियाँ हुईं, जो जटिल ग्राफिकल जानकारी को पहचानने में वर्तमान एआई की सीमाओं को इंगित करता है। लाइफप्रॉम्प्ट के प्रमुख सातोशी एंडो ने उल्लेख किया कि गणित में पूर्ण अंक प्राप्त करने के बावजूद, जापानी भाषा परीक्षण में मॉडल अभी भी जापानी में लिखी गई जानकारी को पर्याप्त रूप से व्यवस्थित नहीं कर पा रहे हैं।

यह प्रयोग जापान के राष्ट्रीय सूचना विज्ञान संस्थान (NII) की पुरानी महत्वाकांक्षाओं की पृष्ठभूमि में देखा जा सकता है, जैसे कि 'टो-रोबो-कुन' परियोजना, जिसका उद्देश्य 2015 में ही विश्वविद्यालय प्रवेश परीक्षा को बेंचमार्क के रूप में उपयोग करके एआई की बौद्धिक श्रम क्षमताओं का आकलन करना था। टो-रोबो-कुन परियोजना के निदेशक नोरिको अराई ने पहले बताया था कि इस तरह के परीक्षणों का वास्तविक उद्देश्य समाज को यह प्रदर्शित करना है कि कृत्रिम बुद्धिमत्ता क्या कर सकती है और क्या नहीं, और यह सुझाव देना है कि एआई किस हद तक श्वेत-कॉलर कार्य संभाल सकता है।

यह उच्च प्रदर्शन शैक्षणिक प्रणालियों के लिए एक महत्वपूर्ण मोड़ प्रस्तुत करता है, क्योंकि लगभग 500,000 छात्रों ने इस दो दिवसीय परीक्षा के लिए आवेदन किया था, जिसके परिणामों का उपयोग 813 विश्वविद्यालयों द्वारा स्क्रीनिंग प्रक्रियाओं के लिए किया जाएगा। एआई मॉडल, जो बिना खोज इंजन वेबसाइटों तक पहुँच के केवल अपने संग्रहीत डेटा का उपयोग करके उत्तर दे रहे थे, ने मानव परीक्षार्थियों के औसत स्कोर को काफी पीछे छोड़ दिया है। यह घटनाक्रम शैक्षणिक मूल्यांकन के भविष्य पर सवाल उठाता है और इस बात पर जोर देता है कि मानव शिक्षा को उन कौशलों पर ध्यान केंद्रित करने की आवश्यकता है जिनमें मनुष्य एआई से बेहतर प्रदर्शन कर सकते हैं।

OpenAI

GPT-5.2 Thinking

Gemini 3.0 Pro

30 दृश्य

स्रोतों

AGERPRES
China.org.cn
Xinhua
Nippon.com
OfficeChai
EvoLink.AI

इस विषय पर और अधिक समाचार पढ़ें:

04 मार्च

OpenAI ने GPT-5.3 इंस्टेंट अपडेट किया पेश: उपयोगकर्ता अनुभव में सुधार और वेब एकीकरण को मिली नई मजबूती

Ole Lehmann

@itsolelehmann

·Follow

anthropic just made switching to claude stupidly easy they launched a "import memory" feature that lets you copy your entire memory from chatgpt (or gemini, whatever) into claude here's how it works (takes like 60 seconds): 1. go to claude . com /import-memory 2. copy the

10:58 AM · Mar 1, 2026

507

Read 46 replies

Watch on X

03 मार्च

एंथ्रोपिक ने पेश किया फ्री मेमोरी इम्पोर्ट टूल: एआई यूजर्स के लिए स्विचिंग की बाधाएं होंगी कम

02 मार्च

एआई द्वारा सृजित कला के कॉपीराइट पर अमेरिकी सुप्रीम कोर्ट का निर्णय कायम

क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।