OpenAI के नए O3, O4-Mini AI मॉडल उच्च 'भ्रम' दर दिखाते हैं

द्वारा संपादित: Veronika Radoslavskaya

मैड्रिड - OpenAI के नवीनतम AI मॉडल, O3 और O4-mini, अपने पूर्ववर्तियों की तुलना में 'भ्रम' की उच्च दर प्रदर्शित करते हैं। PersonQA मूल्यांकन का उपयोग करके किए गए आंतरिक परीक्षणों से पता चला है कि ये मॉडल अधिक बार गलत या मनगढ़ंत जानकारी उत्पन्न करते हैं। O3 मॉडल ने 33% प्रतिक्रियाओं में भ्रम दिखाया, जो O1 मॉडल की दर से लगभग दोगुना है, जबकि O4-mini मॉडल की भ्रम दर 48% तक पहुंच गई। ये नए मॉडल प्रोग्रामिंग, वेब नेविगेशन और स्वायत्त छवि निर्माण जैसे कार्यों के लिए डिज़ाइन किए गए हैं। अपनी उन्नत क्षमताओं के बावजूद, OpenAI इस मुद्दे को स्वीकार करता है और भ्रम दर में वृद्धि के कारण पर सक्रिय रूप से शोध कर रहा है। प्रवक्ता निको फेलिक्स द्वारा पुष्टि किए गए अनुसार, इन अशुद्धियों को दूर करना OpenAI के लिए ध्यान केंद्रित करने का एक सतत क्षेत्र है।

क्या आपने कोई गलती या अशुद्धि पाई?

हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।