अलीबाबा क्लाउड और मूनशॉट एआई ने अगली पीढ़ी के 'रीजनिंग मॉडल्स' का किया अनावरण

18:28, 27 जनवरी

द्वारा संपादित: Veronika Radoslavskaya

🚀 Introducing Qwen3-Max-Thinking, our most capable reasoning model yet. Trained with massive scale and advanced RL, it delivers strong performance across reasoning, knowledge, tool use, and agent capabilities. ✨ Key innovations: ✅ Adaptive tool-use: intelligently leverages

3:13 PM · Jan 26, 2026

4.2K

Read 200 replies

Watch on X

जनवरी 2026 के आखिरी दिनों में, वैश्विक आर्टिफिशियल इंटेलिजेंस परिदृश्य में चीन की ओर से दो अत्यंत शक्तिशाली फ्लैगशिप मॉडल्स का उदय हुआ। अलीबाबा क्लाउड ने अपना 'Qwen3-Max-Thinking' पेश किया, जबकि मूनशॉट एआई ने 'Kimi K2.5' को बाजार में उतारा। ये दोनों ही मॉडल एआई जगत में 'रीजनिंग-फर्स्ट' आर्किटेक्चर की ओर एक महत्वपूर्ण झुकाव को दर्शाते हैं, जिन्हें विशेष रूप से जटिल तर्क और स्वायत्त कार्य निष्पादन के लिए निर्मित किया गया है।

Kimi.ai

@Kimi_Moonshot

·Follow

🥝 Meet Kimi K2.5, Open-Source Visual Agentic Intelligence. 🔹 Global SOTA on Agentic Benchmarks: HLE full set (50.2%), BrowseComp (74.9%) 🔹 Open-source SOTA on Vision and Coding: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Verified (76.8%) 🔹 Code with Taste: turn chats,

5:42 AM · Jan 27, 2026

15.9K

Read 776 replies

Watch on X

26 जनवरी, 2026 को आधिकारिक तौर पर लॉन्च किया गया Qwen3-Max-Thinking एक बड़े पैमाने का रीजनिंग मॉडल है। इसका आर्किटेक्चर एक ट्रिलियन (1 trillion) से अधिक मापदंडों यानी पैरामीटर्स पर फैला हुआ है। यह मॉडल विशेष रूप से बहु-चरणीय तार्किक संश्लेषण और उच्च-स्तरीय तकनीकी समस्याओं के समाधान के लिए इंजीनियरिंग कौशल का एक उत्कृष्ट उदाहरण है, जो एआई की सोचने की क्षमता को नई ऊंचाइयों पर ले जाता है।

एडेप्टिव टूल यूज़: यह एक ऐसी मुख्य विशेषता है जो मॉडल को बातचीत के दौरान सर्च, मेमोरी या कोड इंटरप्रेटर जैसे विकल्पों में से स्वतंत्र रूप से चुनाव करने में सक्षम बनाती है। एआई स्वयं यह निर्धारित करता है कि किसी तथ्य की पुष्टि या गणना के लिए किस बाहरी उपकरण की आवश्यकता है।
टेस्ट-टाइम स्केलिंग (TTS): मॉडल इन्फरेंस-टाइम कंप्यूट स्केलिंग का उपयोग करता है, जिससे यह कठिन समस्याओं को 'सोचने' के लिए अधिक प्रोसेसिंग पावर समर्पित कर पाता है। इसी तकनीक की बदौलत इसने एरिना-हार्ड v2 बेंचमार्क पर 90.2 का प्रभावशाली स्कोर प्राप्त किया है।
बेंचमार्क प्रदर्शन: Qwen3-Max-Thinking ने वैज्ञानिक गणना, गणितीय तर्क और जटिल कोडिंग कार्यों में अपनी उच्च दक्षता का प्रदर्शन किया है, जो इसे तकनीकी क्षेत्रों के लिए एक अनिवार्य उपकरण बनाता है।

इसके ठीक अगले दिन, 27 जनवरी, 2026 को अलीबाबा ग्रुप के समर्थन वाली कंपनी मूनशॉट एआई ने 'Kimi K2.5' को पेश किया। यह एक ओपन-सोर्स और मूल रूप से मल्टीमॉडल एजेंटिक मॉडल है। इस संस्करण को विशेष रूप से समन्वय और बड़े पैमाने पर डेटा प्रोसेसिंग की चुनौतियों से निपटने के लिए अनुकूलित किया गया है, जो इसे आधुनिक उद्यमों के लिए एक शक्तिशाली विकल्प बनाता है।

Kimi K2.5 की संरचना 'मिक्सचर-ऑफ-एक्सपर्ट्स' (MoE) आर्किटेक्चर पर आधारित है। यद्यपि इसकी कुल क्षमता एक ट्रिलियन पैरामीटर्स तक पहुँचती है, लेकिन संचालन के दौरान केवल 32 बिलियन पैरामीटर्स ही सक्रिय होते हैं, जिससे यह ऊर्जा और गणना के मामले में कुशल बना रहता है। इसे 15 ट्रिलियन मिश्रित विजुअल और टेक्स्ट टोकन के एक विशाल डेटासेट पर प्री-ट्रेन किया गया है, जो इसकी व्यापक समझ को पुख्ता करता है।

एजेंट स्वार्म मोड: K2.5 एक परिष्कृत 'एजेंट क्लस्टर' क्षमता पेश करता है, जो इसे एक ही प्रोजेक्ट के लिए 100 विशिष्ट सब-एजेंटों के साथ तालमेल बिठाने की अनुमति देता है।
स्वायत्त वर्कफ़्लो: 'स्वार्म' मोड में, यह सिस्टम बिना किसी मानवीय हस्तक्षेप या पहले से तय वर्कफ़्लो के, जटिल समस्याओं को हल करने के लिए इन एजेंटों को स्वयं निर्देशित कर सकता है।
एजेंटिक दक्षता: यह मॉडल मुख्य रूप से एंटरप्राइज-लेवल ऑटोमेशन के लिए बनाया गया है, जो ब्राउज़र-आधारित शोध और बहु-चरणीय योजना पर ध्यान केंद्रित करते हुए HLE और BrowseComp जैसे बेंचमार्क पर उच्च अंक प्राप्त करता है।

यद्यपि दोनों ही मॉडल ट्रिलियन-पैरामीटर फाउंडेशन का उपयोग करते हैं, लेकिन उनकी कार्यप्रणाली और प्राथमिकताओं में सूक्ष्म अंतर है। जहाँ अलीबाबा का Qwen3-Max-Thinking गहन, पुनरावृत्ति तर्क प्रक्रिया और स्वायत्त उपकरण चयन को प्राथमिकता देता है, वहीं मूनशॉट का Kimi K2.5 मल्टीमॉडल एजेंटिक समन्वय और बड़े पैमाने पर स्वायत्त कार्यप्रवाहों के प्रबंधन पर अधिक ध्यान केंद्रित करता है।