Alibaba презентує Qwen 3.5: архітектура Gated Delta Networks та розріджена MoE для розвитку агентного ШІ

20:38, 16 лютого

Відредаговано: Veronika Radoslavskaya

Don't know when DeepSeek V4 will be released, but another major open-source model, Qwen 3.5, was released first, a big gift for developers.

10:19 AM · Feb 16, 2026

Read more on X

Watch on X

Корпорація Alibaba Group офіційно оголосила про запуск Qwen 3.5, своєї новітньої платформи штучного інтелекту наступного покоління. За словами представників компанії, цей реліз є свідченням фундаментального технічного зсуву в бік так званого «агентного ШІ» (agentic AI). Основний акцент розробники зробили на створенні моделі, спроектованої для виконання складних автономних операцій, що виходять далеко за межі звичайних розмовних функцій чат-ботів.

В основі Qwen 3.5 лежить надзвичайно складна нова архітектура, яка, за даними Alibaba, гармонійно поєднує в собі мережі Gated Delta Networks із фреймворком розрідженої суміші експертів (sparse mixture-of-experts, MoE). Така конструкція дозволяє ефективно вирішити давню дилему між величезним розміром моделі та швидкістю виконання інференсу, забезпечуючи високу продуктивність без надмірних витрат ресурсів.

Технічні характеристики моделі демонструють вражаючий масштаб інженерної думки та оптимізації процесів:

Співвідношення активних та загальних параметрів: Alibaba зазначає, що попри колосальну загальну кількість у 397 мільярдів параметрів, структура MoE дозволяє активувати лише 17 мільярдів параметрів під час кожного прямого проходу.
Ефективність обчислень: на думку розробників, таке вибіркове використання потужностей радикально зменшує обчислювальне навантаження. Це робить модель ідеальною для швидкої генерації токенів та оптимізує економічні показники її промислового впровадження.

Qwen 3.5 була спеціально розроблена для функціонування як автономний агент, здатний до самостійного планування та реалізації багатоетапних робочих процесів. Це відкриває нові горизонти для автоматизації складних завдань, де штучний інтелект може брати на себе роль повноцінного виконавця, а не просто пасивного асистента.

Важливою особливістю системи є її візуальні агентні можливості, що значно розширюють сферу застосування технології. Alibaba наголошує, що модель здатна «бачити» та інтерпретувати інтерфейси програмного забезпечення, приймати на основі цього незалежні рішення та здійснювати необхідні дії в різноманітних додатках. Це дозволяє ШІ взаємодіяти з цифровим середовищем подібно до того, як це робить людина.

Для вирішення найскладніших аналітичних завдань компанія представила закриту ітерацію під назвою Qwen-3.5-Plus. Ця версія пропонує контекстне вікно обсягом в 1 мільйон токенів, що дозволяє проводити глибокий аналіз об'ємних документів та вибудовувати довгі логічні ланцюжки міркувань, зберігаючи ідеальну когерентність тексту протягом усього процесу обробки даних.

З метою підтримки глобального розгортання Alibaba суттєво розширила лінгвістичне охоплення своєї розробки. Qwen 3.5 тепер підтримує 201 окрему мову та діалект, що є значним кроком вперед порівняно зі 119 мовами в попередній версії. Компанія стверджує, що такий прогрес суттєво зміцнює її позиції на стратегічно важливих ринках Південно-Східної Азії та Європи.

Продовжуючи свою стратегію відкритих ваг, Alibaba випустила версію Qwen-3.5-Open. Це рішення надає світовій дослідницькій спільноті вільний доступ до передових архітектурних удосконалень, стимулюючи подальші інновації в галузі відкритого програмного забезпечення та сприяючи розвитку глобальної екосистеми штучного інтелекту.

Щодо продуктивності, то архітектурна оптимізація в Qwen 3.5 призвела до восьмиразового покращення обробки великих робочих навантажень порівняно з серією Qwen 3. У власних бенчмарках Alibaba заявляє, що модель демонструє результати, які повністю відповідають рівню провідних світових систем. Зокрема, йдеться про досягнення паритету з такими гігантами, як GPT-5.2 та Claude Opus 4.6, у завданнях, що стосуються логічного мислення та написання програмного коду.