xAI ने Grok 4.1 लॉन्च किया
xAI ने Grok 4.1 लॉन्च किया: आवाज़ और विज़ुअल रचनात्मकता के लिए एक "अधिक मानवीय" मस्तिष्क
लेखक: Veronika Radoslavskaya
एलन मस्क की आर्टिफिशियल इंटेलिजेंस कंपनी, xAI, ने आधिकारिक तौर पर Grok 4.1 जारी कर दिया है, जो एक महत्वपूर्ण अपडेट है और AI के मनुष्यों के साथ बातचीत करने के तरीके को मौलिक रूप से बदल देता है। जबकि उद्योग बड़े पैमाने पर कच्ची कम्प्यूटेशनल शक्ति पर ध्यान केंद्रित कर रहा है, Grok 4.1 "भावनात्मक बुद्धिमत्ता" (इमोशनल इंटेलिजेंस) और विश्वसनीयता को प्राथमिकता देकर खुद को अलग करता है। यह नया मॉडल xAI की आवाज़ क्षमताओं को उन्नत करने और इसके विकसित हो रहे विज़ुअल टूल को शक्ति प्रदान करने वाला महत्वपूर्ण "तर्क इंजन" (रीजनिंग इंजन) के रूप में कार्य करता है।
Grok 4.1 में सबसे उल्लेखनीय सुधार बारीकियों, व्यंग्य और भावनात्मक उप-पाठ को समझने की इसकी क्षमता है। EQ-Bench3 मूल्यांकन में, जो एक AI की सहानुभूति को मापता है, नए मॉडल ने 1,586 अंक प्राप्त किए, जो पिछली पुनरावृत्तियों की तुलना में पर्याप्त सुधार दर्शाता है। यह दर्शाता है कि अब यह मशीन केवल डेटा संसाधित नहीं करती, बल्कि मानवीय भावनाओं को समझने की दिशा में कदम बढ़ा रही है।
इस उन्नयन का वॉयस मोड के लिए तत्काल प्रभाव पड़ता है। आवाज़ के माध्यम से AI के साथ बातचीत करने वाले उपयोगकर्ता एक रोबोटिक प्रश्न-उत्तर मशीन से एक संवादी साथी में महत्वपूर्ण बदलाव देखेंगे जो "माहौल को पढ़ सकता है" और संदर्भ को समझ सकता है। चूंकि मॉडल अब सूक्ष्म इरादे और लहजे को संसाधित कर सकता है, इसलिए आवाज़ की बातचीत अधिक सहज, स्वाभाविक और जीवंत हो जाती है।
हालांकि Grok 4.1 मुख्य रूप से एक पाठ-आधारित बुद्धिमत्ता है, यह xAI की मल्टीमॉडल महत्वाकांक्षाओं में एक महत्वपूर्ण भूमिका निभाता है। यह मॉडल एक "क्रिएटिव डायरेक्टर" के रूप में कार्य करता है, जो उपयोगकर्ता के अनुरोधों की व्याख्या करने और बाहरी विज़ुअल टूल के लिए अत्यधिक विस्तृत प्रॉम्प्ट लिखने के लिए अपने रिकॉर्ड-तोड़ रचनात्मक लेखन कौशल का उपयोग करता है। Grok 4.1 ने रचनात्मक लेखन में 1,708 एलो (Elo) का प्रभावशाली स्कोर हासिल किया है।
वर्तमान में, यह क्षमता प्लेटफ़ॉर्म की छवि निर्माण (Flux के माध्यम से) को शक्ति प्रदान करती है और नई उभरती हुई छवि-से-वीडियो एनीमेशन सुविधाओं का समर्थन करती है। जबकि पूर्ण पाठ-से-वीडियो निर्माण अभी भी आंतरिक पूर्वावलोकन में है, Grok 4.1 का बेहतर तर्क उपयोगकर्ताओं को अधिक सटीकता के साथ स्थिर छवियों को छोटे एनिमेटेड क्लिप में बदलने की अनुमति देता है। इस प्रकार, यह पाठ और चलती विज़ुअल्स के बीच की खाई को प्रभावी ढंग से पाटने का काम करता है।
विश्वसनीयता के मोर्चे पर, यह मॉडल काफी अधिक सत्यवादी बन गया है। xAI ने उन्नत प्रशिक्षण तकनीकों का उपयोग करके वास्तविक दुनिया की पूछताछ पर भ्रम दर (मनगढ़ंत तथ्य प्रस्तुत करना) को 12.09% से घटाकर केवल 4.22% कर दिया है। कठोर FActScore बेंचमार्क पर, त्रुटि दर लगभग दो-तिहाई कम होकर 3% से नीचे आ गई है। यह सुधार जनरेटिव AI के साथ उपयोगकर्ताओं की सबसे बड़ी समस्याओं में से एक का समाधान करता है।
इन आंतरिक मेट्रिक्स को सार्वजनिक राय का भी समर्थन प्राप्त है। LMArena के "टेक्स्ट एरिना"—जो एक ब्लाइंड क्राउडसोर्स्ड लीडरबोर्ड है—पर Grok 4.1 ने वैश्विक नंबर एक स्थान हासिल किया, जो अपने निकटतम प्रतिद्वंद्वी से 31 अंक आगे आराम से बैठा है। यह अत्याधुनिक मॉडल वर्तमान में X प्लेटफॉर्म और मोबाइल ऐप्स पर उपयोगकर्ताओं के लिए रोल आउट किया जा रहा है, जिससे यह व्यापक रूप से उपलब्ध हो गया है।
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
