Alibaba Cloud и Moonshot AI представили флагманские модели ИИ нового поколения

18:28, 27 января

Отредактировано: Veronika Radoslavskaya

🚀 Introducing Qwen3-Max-Thinking, our most capable reasoning model yet. Trained with massive scale and advanced RL, it delivers strong performance across reasoning, knowledge, tool use, and agent capabilities. ✨ Key innovations: ✅ Adaptive tool-use: intelligently leverages

3:13 PM · Jan 26, 2026

4.2K

Read 199 replies

Watch on X

В конце января 2026 года ландшафт индустрии искусственного интеллекта претерпел значительные изменения с одновременным выходом двух высокопроизводительных флагманских моделей из Китая: Qwen3-Max-Thinking от Alibaba Cloud и Kimi K2.5 от Moonshot AI. Оба релиза знаменуют собой важный стратегический сдвиг в сторону архитектур, ориентированных прежде всего на рассуждение (reasoning-first), которые предназначены для решения сложнейших логических задач и автономного выполнения комплексных поручений.

Kimi.ai

@Kimi_Moonshot

·Follow

🥝 Meet Kimi K2.5, Open-Source Visual Agentic Intelligence. 🔹 Global SOTA on Agentic Benchmarks: HLE full set (50.2%), BrowseComp (74.9%) 🔹 Open-source SOTA on Vision and Coding: MMMU Pro (78.5%), VideoMMMU (86.6%), SWE-bench Verified (76.8%) 🔹 Code with Taste: turn chats,

5:42 AM · Jan 27, 2026

15.9K

Read 780 replies

Watch on X

Компания Alibaba Cloud официально представила Qwen3-Max-Thinking 26 января 2026 года. Эта крупномасштабная модель рассуждения построена на архитектуре, объем которой превышает один триллион параметров. Система специально спроектирована для обеспечения многоэтапного логического синтеза и эффективного поиска решений для передовых технических проблем.

Адаптивное использование инструментов: Ключевая функция, позволяющая модели самостоятельно выбирать между поиском в интернете, обращением к памяти или использованием интерпретатора кода во время диалога. ИИ независимо определяет, какой внешний инструмент требуется для верификации фактов или проведения расчетов на основе запроса пользователя.
Масштабирование во время вывода (TTS): Модель применяет технологию Test-Time Scaling, что позволяет ей выделять больше вычислительных мощностей на процесс «обдумывания» сложных задач. Данный подход обеспечил модели впечатляющий результат в 90,2 балла в бенчмарке Arena-Hard v2.
Производительность в тестах: Qwen3-Max-Thinking продемонстрировала исключительную эффективность в различных тестах на логическое мышление, подтвердив свои высокие возможности в области научных вычислений, математической логики и написания сложного программного кода.

Уже на следующий день, 27 января 2026 года, компания Moonshot AI, действующая при поддержке Alibaba Group, презентовала Kimi K2.5. Эта разработка представляет собой нативно мультимодальную агентную модель с открытым исходным кодом, которая была оптимизирована для масштабной обработки данных и высокоуровневой координации процессов.

Архитектура Mixture-of-Experts (MoE): При общем объеме в один триллион параметров, архитектура MoE гарантирует, что в активном состоянии во время работы находятся только 32 миллиарда параметров. Модель прошла этап предварительного обучения на колоссальном массиве данных, состоящем из 15 триллионов смешанных визуальных и текстовых токенов.
Режим «Рой агентов» (Agent Swarm Mode): K2.5 внедряет продвинутую концепцию кластера агентов, позволяющую координировать до 100 специализированных субагентов для выполнения одного проекта. В режиме «Роя» система может самостоятельно управлять этими агентами для решения комплексных проблем без необходимости в заранее заданных рабочих процессах.
Агентная эффективность: Модель специально адаптирована для автоматизации на уровне предприятий, демонстрируя высокие показатели в таких агентных бенчмарках, как HLE и BrowseComp, благодаря фокусу на многошаговом планировании и проведении глубоких исследований через браузер.

Несмотря на то, что обе представленные модели базируются на фундаменте из триллиона параметров, их функциональные приоритеты имеют различия. Решение от Alibaba, Qwen3-Max-Thinking, делает основной упор на глубокие итеративные рассуждения и автономный выбор инструментов, в то время как Kimi K2.5 от Moonshot концентрируется на мультимодальной координации агентов и создании масштабных автономных рабочих процессов.

Alibaba Cloud