ओपनएआई ने आधिकारिक तौर पर 11 दिसंबर, 2025 को जीपीटी-5.2 मॉडल श्रृंखला जारी की है। यह नई पेशकश विशेष रूप से पेशेवर ज्ञान-आधारित कार्यों और स्वायत्त एजेंट अनुप्रयोगों के लिए डिज़ाइन की गई है, जिसमें तीन-चरणीय मॉडल प्रणाली शामिल है। कंपनी का दावा है कि यह अब तक का उनका सबसे सक्षम मॉडल है, जो स्प्रेडशीट निर्माण, प्रस्तुति विकास, कोडिंग, विज़न प्रोसेसिंग और विस्तारित-संदर्भ तर्क क्षमताओं में स्पष्ट सुधार दर्शाता है।
तीन विशिष्ट संस्करण
जीपीटी-5.2 की श्रृंखला में तीन अलग-अलग विन्यास शामिल हैं: इंस्टेंट (Instant), थिंकिंग (Thinking), और प्रो (Pro)। प्रत्येक संस्करण को विशिष्ट जटिलता स्तरों और उपयोग के मामलों के अनुरूप बनाया गया है। इंस्टेंट संस्करण को सामान्य जानकारी प्राप्त करने, लेखन और अनुवाद जैसे त्वरित कार्यों के लिए गति को प्राथमिकता देने के लिए अनुकूलित किया गया है। दूसरी ओर, थिंकिंग संस्करण जटिल संरचित कार्यों जैसे कोडिंग, लंबे दस्तावेज़ों का विश्लेषण, गणितीय गणना और योजना बनाने में उत्कृष्टता प्राप्त करता है। प्रो विन्यास उच्चतम क्षमता वाला स्तर है, जिसे सबसे कठिन समस्याओं के लिए अधिकतम सटीकता और विश्वसनीयता प्रदान करने हेतु विकसित किया गया है।
मानदंडों पर प्रदर्शन
जीपीटी-5.2 थिंकिंग ने एआईएमई 2025 प्रतियोगिता गणित परीक्षा में 100% सटीकता हासिल करके एक नया बेंचमार्क स्थापित किया है। इसके अतिरिक्त, जीडीपीवैल (GDPval) नामक एक मूल्यांकन, जो 44 व्यवसायों में फैले ज्ञान कार्य का आकलन करता है, में इस मॉडल ने उद्योग पेशेवरों के साथ सीधे मुकाबले में 70.9% मामलों में जीत हासिल की या बराबरी की। यह पहली बार है जब ओपनएआई के किसी मॉडल ने आर्थिक रूप से मूल्यवान कार्यों पर विशेषज्ञ-स्तर का प्रदर्शन दर्ज किया है। ओपनएआई के आंतरिक बेंचमार्क चार्ट पर, जीपीटी-5.2 थिंकिंग एसडब्ल्यूई-बेंच प्रो (SWE-Bench Pro) से लेकर जीपीक्यूए डायमंड (GPQA Diamond) और एआरसी-एजीआई (ARC-AGI) सूट तक लगभग हर सूचीबद्ध तर्क परीक्षण में जेमिनी 3 (Gemini 3) और एंथ्रोपिक के क्लॉड ओपस 4.5 (Anthropic's Claude Opus 4.5) से आगे निकल गया है।
कोडिंग और सॉफ्टवेयर इंजीनियरिंग में प्रगति
वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग मूल्यांकन, एसडब्ल्यूई-बेंच प्रो, जिसने कई प्रोग्रामिंग भाषाओं का परीक्षण किया, में जीपीटी-5.2 थिंकिंग ने 55.6% अंक प्राप्त किए, जो जीपीटी-5.1 के 50.8% से बेहतर प्रदर्शन है। कोडिंग के क्षेत्र में, इस मॉडल ने एसडब्ल्यूई-बेंच वेरिफाइड (SWE-bench Verified) पर 80% का प्रभावशाली स्कोर भी दर्ज किया। विंडसर्फ (Windsurf) और चार्लीकोड (CharlieCode) जैसी कोडिंग स्टार्टअप्स जटिल बहु-चरणीय कार्यप्रवाहों पर अत्याधुनिक एजेंट कोडिंग प्रदर्शन और मापने योग्य लाभ की रिपोर्ट कर रहे हैं।
विश्वसनीयता और संदर्भ प्रबंधन
जीपीटी-5.1 की तुलना में जीपीटी-5.2 थिंकिंग के उत्तरों में 30% कम त्रुटियां पाई गई हैं, जिससे यह दैनिक निर्णय लेने, अनुसंधान और लेखन कार्यों के लिए अधिक भरोसेमंद बन गया है। यह मॉडल सैकड़ों हजारों टोकन तक विस्तारित संदर्भ विंडो का समर्थन करता है, और बहु-चरणीय सह-संदर्भ समाधान कार्यों पर लगभग त्रुटिहीन सटीकता प्रदर्शित करता है। इसके विज़न क्षमताओं में भी उल्लेखनीय सुधार हुआ है, जिससे चार्ट व्याख्या और सॉफ्टवेयर इंटरफ़ेस समझ बेंचमार्क पर त्रुटि दर लगभग आधी हो गई है।
रणनीतिक परिदृश्य
यह रिलीज़ गूगल के जेमिनी 3 के साथ बढ़ती प्रतिस्पर्धा के बीच आई है, जो वर्तमान में कोडिंग को छोड़कर अधिकांश बेंचमार्क पर एलएमएरीना (LMArena) की लीडरबोर्ड पर शीर्ष पर है। इस महीने की शुरुआत में, सीईओ सैम अल्टमैन ने कथित तौर पर कर्मचारियों को एक आंतरिक 'कोड रेड' ज्ञापन जारी किया था। इस ज्ञापन में गूगल से उपभोक्ता बाज़ार हिस्सेदारी खोने की चिंताओं और चैटजीपीटी (ChatGPT) ट्रैफिक में गिरावट के बीच प्राथमिकताओं को बदलने का आह्वान किया गया था। ज्ञापन में विज्ञापन शुरू करने जैसी प्रतिबद्धताओं को रोकने और इसके बजाय एक बेहतर चैटजीपीटी अनुभव बनाने पर ध्यान केंद्रित करने की बात कही गई थी।
उपलब्धता और सुरक्षा उपाय
जीपीटी-5.2 वर्तमान में सशुल्क चैटजीपीटी ग्राहकों (प्लस, प्रो, बिजनेस, एंटरप्राइज) के लिए चरणबद्ध तरीके से जारी किया जा रहा है और यह तीनों संस्करणों में एपीआई के माध्यम से तुरंत उपलब्ध है। ओपनएआई ने मानसिक स्वास्थ्य उपयोग और किशोरों के लिए आयु सत्यापन से संबंधित नए सुरक्षा उपायों की भी घोषणा की है, हालांकि लॉन्च ब्रीफिंग के दौरान इन पर विशेष जोर नहीं दिया गया था।



