У серпні 2025 року китайські технологічні гіганти ByteDance та стартап DeepSeek представили значні оновлення у сфері штучного інтелекту, випустивши нові потужні моделі. Ці розробки свідчать про стрімкий розвиток галузі в Китаї та її зростаючу конкурентоспроможність на світовій арені, демонструючи стратегічний фокус країни на технологічному суверенітеті.
ByteDance, материнська компанія TikTok, представила три варіанти своєї нової моделі Seed-OSS-36B. Ця модель з відкритим кодом, що має 36 мільярдів параметрів, вирізняється здатністю обробляти надзвичайно довгі контексти (до 512 тис. токенів) та орієнтована на зручність для розробників. За даними компанії, Seed-OSS-36B демонструє конкурентоспроможну продуктивність, яка відповідає або перевершує аналогічні моделі від провідних світових розробників у тестових бенчмарках. Випуск моделі на платформі Hugging Face підкреслює стратегію ByteDance щодо сприяння глобальній співпраці та інноваціям у сфері ШІ.
Паралельно китайський стартап DeepSeek анонсував оновлену версію своєї моделі DeepSeek-V3.1. Ця модель оснащена гібридною архітектурою висновків, що дозволяє їй ефективно працювати як у режимі міркувань, так і в режимі швидких відповідей, демонструючи покращену швидкість обробки та розширені агентні можливості. Особливо значущим є той факт, що модель оптимізована для роботи на китайських чипах, що є важливим кроком для розвитку вітчизняної напівпровідникової промисловості Китаю. З 685 мільярдами параметрів та можливістю обробки до 128 000 токенів контексту, DeepSeek-V3.1 вже демонструє результати, порівнянні з провідними моделями, зокрема, показуючи 71,6% на бенчмарку Aider для оцінки кодування.
Ці розробки відбуваються на тлі загальної стратегії Китаю з розвитку штучного інтелекту, яка передбачає значні державні інвестиції, що сягають 98 мільярдів доларів у 2025 році, та фокус на зменшенні залежності від іноземних технологій. Експерти відзначають, що китайські компанії активно використовують підхід відкритого коду як конкурентну перевагу, що дозволяє їм швидко нарощувати свою присутність на глобальному ринку та пропонувати більш доступні рішення порівняно із західними аналогами. Ця стратегія сприяє демократизації доступу до передових ШІ-технологій та стимулює інновації.
Водночас, ці досягнення відбуваються в контексті геополітичних викликів, зокрема американських експортних обмежень на передові напівпровідники, запроваджених з жовтня 2022 року та посилених у 2023-2024 роках. Китай активно шукає шляхи обходу цих обмежень та посилення власної промисловості, що робить оптимізацію моделей під вітчизняне обладнання, як у випадку DeepSeek-V3.1, особливо важливою. Ці кроки свідчать про прагнення Китаю не лише наздогнати, але й перевершити західних конкурентів у гонці за технологічне лідерство в галузі штучного інтелекту, роблячи ставку на ефективність, відкритість та інтеграцію з власною промисловою базою.