अलीबाबा क्लाउड और मूनशॉट एआई ने अगली पीढ़ी के 'रीजनिंग मॉडल्स' का किया अनावरण

द्वारा संपादित: Veronika Radoslavskaya

🚀 Introducing Qwen3-Max-Thinking, our most capable reasoning model yet. Trained with massive scale and advanced RL, it delivers strong performance across reasoning, knowledge, tool use, and agent capabilities. ✨ Key innovations: ✅ Adaptive tool-use: intelligently leverages

Image
4.2K
Reply

जनवरी 2026 के आखिरी दिनों में, वैश्विक आर्टिफिशियल इंटेलिजेंस परिदृश्य में चीन की ओर से दो अत्यंत शक्तिशाली फ्लैगशिप मॉडल्स का उदय हुआ। अलीबाबा क्लाउड ने अपना 'Qwen3-Max-Thinking' पेश किया, जबकि मूनशॉट एआई ने 'Kimi K2.5' को बाजार में उतारा। ये दोनों ही मॉडल एआई जगत में 'रीजनिंग-फर्स्ट' आर्किटेक्चर की ओर एक महत्वपूर्ण झुकाव को दर्शाते हैं, जिन्हें विशेष रूप से जटिल तर्क और स्वायत्त कार्य निष्पादन के लिए निर्मित किया गया है।

26 जनवरी, 2026 को आधिकारिक तौर पर लॉन्च किया गया Qwen3-Max-Thinking एक बड़े पैमाने का रीजनिंग मॉडल है। इसका आर्किटेक्चर एक ट्रिलियन (1 trillion) से अधिक मापदंडों यानी पैरामीटर्स पर फैला हुआ है। यह मॉडल विशेष रूप से बहु-चरणीय तार्किक संश्लेषण और उच्च-स्तरीय तकनीकी समस्याओं के समाधान के लिए इंजीनियरिंग कौशल का एक उत्कृष्ट उदाहरण है, जो एआई की सोचने की क्षमता को नई ऊंचाइयों पर ले जाता है।

  • एडेप्टिव टूल यूज़: यह एक ऐसी मुख्य विशेषता है जो मॉडल को बातचीत के दौरान सर्च, मेमोरी या कोड इंटरप्रेटर जैसे विकल्पों में से स्वतंत्र रूप से चुनाव करने में सक्षम बनाती है। एआई स्वयं यह निर्धारित करता है कि किसी तथ्य की पुष्टि या गणना के लिए किस बाहरी उपकरण की आवश्यकता है।
  • टेस्ट-टाइम स्केलिंग (TTS): मॉडल इन्फरेंस-टाइम कंप्यूट स्केलिंग का उपयोग करता है, जिससे यह कठिन समस्याओं को 'सोचने' के लिए अधिक प्रोसेसिंग पावर समर्पित कर पाता है। इसी तकनीक की बदौलत इसने एरिना-हार्ड v2 बेंचमार्क पर 90.2 का प्रभावशाली स्कोर प्राप्त किया है।
  • बेंचमार्क प्रदर्शन: Qwen3-Max-Thinking ने वैज्ञानिक गणना, गणितीय तर्क और जटिल कोडिंग कार्यों में अपनी उच्च दक्षता का प्रदर्शन किया है, जो इसे तकनीकी क्षेत्रों के लिए एक अनिवार्य उपकरण बनाता है।

इसके ठीक अगले दिन, 27 जनवरी, 2026 को अलीबाबा ग्रुप के समर्थन वाली कंपनी मूनशॉट एआई ने 'Kimi K2.5' को पेश किया। यह एक ओपन-सोर्स और मूल रूप से मल्टीमॉडल एजेंटिक मॉडल है। इस संस्करण को विशेष रूप से समन्वय और बड़े पैमाने पर डेटा प्रोसेसिंग की चुनौतियों से निपटने के लिए अनुकूलित किया गया है, जो इसे आधुनिक उद्यमों के लिए एक शक्तिशाली विकल्प बनाता है।

Kimi K2.5 की संरचना 'मिक्सचर-ऑफ-एक्सपर्ट्स' (MoE) आर्किटेक्चर पर आधारित है। यद्यपि इसकी कुल क्षमता एक ट्रिलियन पैरामीटर्स तक पहुँचती है, लेकिन संचालन के दौरान केवल 32 बिलियन पैरामीटर्स ही सक्रिय होते हैं, जिससे यह ऊर्जा और गणना के मामले में कुशल बना रहता है। इसे 15 ट्रिलियन मिश्रित विजुअल और टेक्स्ट टोकन के एक विशाल डेटासेट पर प्री-ट्रेन किया गया है, जो इसकी व्यापक समझ को पुख्ता करता है।

  • एजेंट स्वार्म मोड: K2.5 एक परिष्कृत 'एजेंट क्लस्टर' क्षमता पेश करता है, जो इसे एक ही प्रोजेक्ट के लिए 100 विशिष्ट सब-एजेंटों के साथ तालमेल बिठाने की अनुमति देता है।
  • स्वायत्त वर्कफ़्लो: 'स्वार्म' मोड में, यह सिस्टम बिना किसी मानवीय हस्तक्षेप या पहले से तय वर्कफ़्लो के, जटिल समस्याओं को हल करने के लिए इन एजेंटों को स्वयं निर्देशित कर सकता है।
  • एजेंटिक दक्षता: यह मॉडल मुख्य रूप से एंटरप्राइज-लेवल ऑटोमेशन के लिए बनाया गया है, जो ब्राउज़र-आधारित शोध और बहु-चरणीय योजना पर ध्यान केंद्रित करते हुए HLE और BrowseComp जैसे बेंचमार्क पर उच्च अंक प्राप्त करता है।

यद्यपि दोनों ही मॉडल ट्रिलियन-पैरामीटर फाउंडेशन का उपयोग करते हैं, लेकिन उनकी कार्यप्रणाली और प्राथमिकताओं में सूक्ष्म अंतर है। जहाँ अलीबाबा का Qwen3-Max-Thinking गहन, पुनरावृत्ति तर्क प्रक्रिया और स्वायत्त उपकरण चयन को प्राथमिकता देता है, वहीं मूनशॉट का Kimi K2.5 मल्टीमॉडल एजेंटिक समन्वय और बड़े पैमाने पर स्वायत्त कार्यप्रवाहों के प्रबंधन पर अधिक ध्यान केंद्रित करता है।

11 दृश्य

स्रोतों

  • europa press

  • Qwen Team

  • Moonshot AI Open Platform - Kimi Large Language Model API Service

  • Atlas Cloud

  • Vertu

  • Seeking Alpha - Power to Investors

क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।