🚀 Introducing Qwen3-Max-Thinking, our most capable reasoning model yet. Trained with massive scale and advanced RL, it delivers strong performance across reasoning, knowledge, tool use, and agent capabilities. ✨ Key innovations: ✅ Adaptive tool-use: intelligently leverages
अलीबाबा क्लाउड और मूनशॉट एआई ने अगली पीढ़ी के 'रीजनिंग मॉडल्स' का किया अनावरण
द्वारा संपादित: Veronika Radoslavskaya
जनवरी 2026 के आखिरी दिनों में, वैश्विक आर्टिफिशियल इंटेलिजेंस परिदृश्य में चीन की ओर से दो अत्यंत शक्तिशाली फ्लैगशिप मॉडल्स का उदय हुआ। अलीबाबा क्लाउड ने अपना 'Qwen3-Max-Thinking' पेश किया, जबकि मूनशॉट एआई ने 'Kimi K2.5' को बाजार में उतारा। ये दोनों ही मॉडल एआई जगत में 'रीजनिंग-फर्स्ट' आर्किटेक्चर की ओर एक महत्वपूर्ण झुकाव को दर्शाते हैं, जिन्हें विशेष रूप से जटिल तर्क और स्वायत्त कार्य निष्पादन के लिए निर्मित किया गया है।
🥝 Meet Kimi K2.5, Open-Source Visual Agentic Intelligence. 🔹 Global SOTA on Agentic Benchmarks: HLE full set (50.2%), BrowseComp (74.9%) 🔹 Open-source SOTA on Vision and Coding: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Verified (76.8%) 🔹 Code with Taste: turn chats,
26 जनवरी, 2026 को आधिकारिक तौर पर लॉन्च किया गया Qwen3-Max-Thinking एक बड़े पैमाने का रीजनिंग मॉडल है। इसका आर्किटेक्चर एक ट्रिलियन (1 trillion) से अधिक मापदंडों यानी पैरामीटर्स पर फैला हुआ है। यह मॉडल विशेष रूप से बहु-चरणीय तार्किक संश्लेषण और उच्च-स्तरीय तकनीकी समस्याओं के समाधान के लिए इंजीनियरिंग कौशल का एक उत्कृष्ट उदाहरण है, जो एआई की सोचने की क्षमता को नई ऊंचाइयों पर ले जाता है।
- एडेप्टिव टूल यूज़: यह एक ऐसी मुख्य विशेषता है जो मॉडल को बातचीत के दौरान सर्च, मेमोरी या कोड इंटरप्रेटर जैसे विकल्पों में से स्वतंत्र रूप से चुनाव करने में सक्षम बनाती है। एआई स्वयं यह निर्धारित करता है कि किसी तथ्य की पुष्टि या गणना के लिए किस बाहरी उपकरण की आवश्यकता है।
- टेस्ट-टाइम स्केलिंग (TTS): मॉडल इन्फरेंस-टाइम कंप्यूट स्केलिंग का उपयोग करता है, जिससे यह कठिन समस्याओं को 'सोचने' के लिए अधिक प्रोसेसिंग पावर समर्पित कर पाता है। इसी तकनीक की बदौलत इसने एरिना-हार्ड v2 बेंचमार्क पर 90.2 का प्रभावशाली स्कोर प्राप्त किया है।
- बेंचमार्क प्रदर्शन: Qwen3-Max-Thinking ने वैज्ञानिक गणना, गणितीय तर्क और जटिल कोडिंग कार्यों में अपनी उच्च दक्षता का प्रदर्शन किया है, जो इसे तकनीकी क्षेत्रों के लिए एक अनिवार्य उपकरण बनाता है।
इसके ठीक अगले दिन, 27 जनवरी, 2026 को अलीबाबा ग्रुप के समर्थन वाली कंपनी मूनशॉट एआई ने 'Kimi K2.5' को पेश किया। यह एक ओपन-सोर्स और मूल रूप से मल्टीमॉडल एजेंटिक मॉडल है। इस संस्करण को विशेष रूप से समन्वय और बड़े पैमाने पर डेटा प्रोसेसिंग की चुनौतियों से निपटने के लिए अनुकूलित किया गया है, जो इसे आधुनिक उद्यमों के लिए एक शक्तिशाली विकल्प बनाता है।
Kimi K2.5 की संरचना 'मिक्सचर-ऑफ-एक्सपर्ट्स' (MoE) आर्किटेक्चर पर आधारित है। यद्यपि इसकी कुल क्षमता एक ट्रिलियन पैरामीटर्स तक पहुँचती है, लेकिन संचालन के दौरान केवल 32 बिलियन पैरामीटर्स ही सक्रिय होते हैं, जिससे यह ऊर्जा और गणना के मामले में कुशल बना रहता है। इसे 15 ट्रिलियन मिश्रित विजुअल और टेक्स्ट टोकन के एक विशाल डेटासेट पर प्री-ट्रेन किया गया है, जो इसकी व्यापक समझ को पुख्ता करता है।
- एजेंट स्वार्म मोड: K2.5 एक परिष्कृत 'एजेंट क्लस्टर' क्षमता पेश करता है, जो इसे एक ही प्रोजेक्ट के लिए 100 विशिष्ट सब-एजेंटों के साथ तालमेल बिठाने की अनुमति देता है।
- स्वायत्त वर्कफ़्लो: 'स्वार्म' मोड में, यह सिस्टम बिना किसी मानवीय हस्तक्षेप या पहले से तय वर्कफ़्लो के, जटिल समस्याओं को हल करने के लिए इन एजेंटों को स्वयं निर्देशित कर सकता है।
- एजेंटिक दक्षता: यह मॉडल मुख्य रूप से एंटरप्राइज-लेवल ऑटोमेशन के लिए बनाया गया है, जो ब्राउज़र-आधारित शोध और बहु-चरणीय योजना पर ध्यान केंद्रित करते हुए HLE और BrowseComp जैसे बेंचमार्क पर उच्च अंक प्राप्त करता है।
यद्यपि दोनों ही मॉडल ट्रिलियन-पैरामीटर फाउंडेशन का उपयोग करते हैं, लेकिन उनकी कार्यप्रणाली और प्राथमिकताओं में सूक्ष्म अंतर है। जहाँ अलीबाबा का Qwen3-Max-Thinking गहन, पुनरावृत्ति तर्क प्रक्रिया और स्वायत्त उपकरण चयन को प्राथमिकता देता है, वहीं मूनशॉट का Kimi K2.5 मल्टीमॉडल एजेंटिक समन्वय और बड़े पैमाने पर स्वायत्त कार्यप्रवाहों के प्रबंधन पर अधिक ध्यान केंद्रित करता है।
स्रोतों
europa press
Qwen Team
Moonshot AI Open Platform - Kimi Large Language Model API Service
Atlas Cloud
Vertu
Seeking Alpha - Power to Investors



