ओपनएआई ने व्यावसायिक कार्यप्रवाहों के लिए तीन-स्तरीय वास्तुकला के साथ जीपीटी-5.2 का अनावरण किया
लेखक: Veronika Radoslavskaya
ओपनएआई ने आधिकारिक तौर पर 11 दिसंबर, 2025 को जीपीटी-5.2 मॉडल श्रृंखला जारी की है। यह नई पेशकश विशेष रूप से पेशेवर ज्ञान-आधारित कार्यों और स्वायत्त एजेंट अनुप्रयोगों के लिए डिज़ाइन की गई है, जिसमें तीन-चरणीय मॉडल प्रणाली शामिल है। कंपनी का दावा है कि यह अब तक का उनका सबसे सक्षम मॉडल है, जो स्प्रेडशीट निर्माण, प्रस्तुति विकास, कोडिंग, विज़न प्रोसेसिंग और विस्तारित-संदर्भ तर्क क्षमताओं में स्पष्ट सुधार दर्शाता है।
तीन विशिष्ट संस्करण
जीपीटी-5.2 की श्रृंखला में तीन अलग-अलग विन्यास शामिल हैं: इंस्टेंट (Instant), थिंकिंग (Thinking), और प्रो (Pro)। प्रत्येक संस्करण को विशिष्ट जटिलता स्तरों और उपयोग के मामलों के अनुरूप बनाया गया है। इंस्टेंट संस्करण को सामान्य जानकारी प्राप्त करने, लेखन और अनुवाद जैसे त्वरित कार्यों के लिए गति को प्राथमिकता देने के लिए अनुकूलित किया गया है। दूसरी ओर, थिंकिंग संस्करण जटिल संरचित कार्यों जैसे कोडिंग, लंबे दस्तावेज़ों का विश्लेषण, गणितीय गणना और योजना बनाने में उत्कृष्टता प्राप्त करता है। प्रो विन्यास उच्चतम क्षमता वाला स्तर है, जिसे सबसे कठिन समस्याओं के लिए अधिकतम सटीकता और विश्वसनीयता प्रदान करने हेतु विकसित किया गया है।
मानदंडों पर प्रदर्शन
जीपीटी-5.2 थिंकिंग ने एआईएमई 2025 प्रतियोगिता गणित परीक्षा में 100% सटीकता हासिल करके एक नया बेंचमार्क स्थापित किया है। इसके अतिरिक्त, जीडीपीवैल (GDPval) नामक एक मूल्यांकन, जो 44 व्यवसायों में फैले ज्ञान कार्य का आकलन करता है, में इस मॉडल ने उद्योग पेशेवरों के साथ सीधे मुकाबले में 70.9% मामलों में जीत हासिल की या बराबरी की। यह पहली बार है जब ओपनएआई के किसी मॉडल ने आर्थिक रूप से मूल्यवान कार्यों पर विशेषज्ञ-स्तर का प्रदर्शन दर्ज किया है। ओपनएआई के आंतरिक बेंचमार्क चार्ट पर, जीपीटी-5.2 थिंकिंग एसडब्ल्यूई-बेंच प्रो (SWE-Bench Pro) से लेकर जीपीक्यूए डायमंड (GPQA Diamond) और एआरसी-एजीआई (ARC-AGI) सूट तक लगभग हर सूचीबद्ध तर्क परीक्षण में जेमिनी 3 (Gemini 3) और एंथ्रोपिक के क्लॉड ओपस 4.5 (Anthropic's Claude Opus 4.5) से आगे निकल गया है।
कोडिंग और सॉफ्टवेयर इंजीनियरिंग में प्रगति
वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग मूल्यांकन, एसडब्ल्यूई-बेंच प्रो, जिसने कई प्रोग्रामिंग भाषाओं का परीक्षण किया, में जीपीटी-5.2 थिंकिंग ने 55.6% अंक प्राप्त किए, जो जीपीटी-5.1 के 50.8% से बेहतर प्रदर्शन है। कोडिंग के क्षेत्र में, इस मॉडल ने एसडब्ल्यूई-बेंच वेरिफाइड (SWE-bench Verified) पर 80% का प्रभावशाली स्कोर भी दर्ज किया। विंडसर्फ (Windsurf) और चार्लीकोड (CharlieCode) जैसी कोडिंग स्टार्टअप्स जटिल बहु-चरणीय कार्यप्रवाहों पर अत्याधुनिक एजेंट कोडिंग प्रदर्शन और मापने योग्य लाभ की रिपोर्ट कर रहे हैं।
विश्वसनीयता और संदर्भ प्रबंधन
जीपीटी-5.1 की तुलना में जीपीटी-5.2 थिंकिंग के उत्तरों में 30% कम त्रुटियां पाई गई हैं, जिससे यह दैनिक निर्णय लेने, अनुसंधान और लेखन कार्यों के लिए अधिक भरोसेमंद बन गया है। यह मॉडल सैकड़ों हजारों टोकन तक विस्तारित संदर्भ विंडो का समर्थन करता है, और बहु-चरणीय सह-संदर्भ समाधान कार्यों पर लगभग त्रुटिहीन सटीकता प्रदर्शित करता है। इसके विज़न क्षमताओं में भी उल्लेखनीय सुधार हुआ है, जिससे चार्ट व्याख्या और सॉफ्टवेयर इंटरफ़ेस समझ बेंचमार्क पर त्रुटि दर लगभग आधी हो गई है।
रणनीतिक परिदृश्य
यह रिलीज़ गूगल के जेमिनी 3 के साथ बढ़ती प्रतिस्पर्धा के बीच आई है, जो वर्तमान में कोडिंग को छोड़कर अधिकांश बेंचमार्क पर एलएमएरीना (LMArena) की लीडरबोर्ड पर शीर्ष पर है। इस महीने की शुरुआत में, सीईओ सैम अल्टमैन ने कथित तौर पर कर्मचारियों को एक आंतरिक 'कोड रेड' ज्ञापन जारी किया था। इस ज्ञापन में गूगल से उपभोक्ता बाज़ार हिस्सेदारी खोने की चिंताओं और चैटजीपीटी (ChatGPT) ट्रैफिक में गिरावट के बीच प्राथमिकताओं को बदलने का आह्वान किया गया था। ज्ञापन में विज्ञापन शुरू करने जैसी प्रतिबद्धताओं को रोकने और इसके बजाय एक बेहतर चैटजीपीटी अनुभव बनाने पर ध्यान केंद्रित करने की बात कही गई थी।
उपलब्धता और सुरक्षा उपाय
जीपीटी-5.2 वर्तमान में सशुल्क चैटजीपीटी ग्राहकों (प्लस, प्रो, बिजनेस, एंटरप्राइज) के लिए चरणबद्ध तरीके से जारी किया जा रहा है और यह तीनों संस्करणों में एपीआई के माध्यम से तुरंत उपलब्ध है। ओपनएआई ने मानसिक स्वास्थ्य उपयोग और किशोरों के लिए आयु सत्यापन से संबंधित नए सुरक्षा उपायों की भी घोषणा की है, हालांकि लॉन्च ब्रीफिंग के दौरान इन पर विशेष जोर नहीं दिया गया था।
23 दृश्य
स्रोतों
OpenAI Blog
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
