Китайська компанія DeepSeek, що займається розробкою штучного інтелекту, представила свою нову експериментальну модель DeepSeek-V3.2-Exp. Ця модель є проміжним етапом на шляху до архітектури наступного покоління та супроводжується значним зниженням цін на API – більш ніж на 50%. Основний акцент моделі зроблено на підвищенні ефективності обробки довгих текстових послідовностей.
В основі DeepSeek-V3.2-Exp лежить інноваційний механізм DeepSeek Sparse Attention (DSA), який вперше реалізує тонку розріджену увагу. Ця технологія дозволяє оптимізувати процеси тренування та інференсу для великих обсягів тексту, суттєво зменшуючи обчислювальні витрати та потреби в пам'яті порівняно з попередньою моделлю V3.1-Terminus. DeepSeek також відкрив доступ до вихідного коду операторів GPU у версіях CUDA та TileLang.
Одним із ключових аспектів анонсу є радикальне зниження вартості використання API DeepSeek. Компанія заявила про скорочення цін більш ніж на 50%. Зокрема, вартість введення даних при кешуванні знизилася з 0.5 до 0.2 юанів за мільйон токенів, а без кешування – з 4 до 2 юанів. Ціна виведення даних також зазнала значного зменшення, впавши з 12 до 3 юанів за мільйон токенів. Це робить передові технології ШІ доступнішими для ширшого кола розробників та стартапів.
Цей крок DeepSeek відбувається на тлі стрімкого зростання ринку штучного інтелекту в Китаї. За даними аналітиків, ринок ШІ в Китаї оцінювався приблизно в 29 мільярдів доларів США у 2023 році і, за прогнозами, досягне понад 150 мільярдів доларів до 2032 року, демонструючи середньорічний темп зростання близько 20%. Китайські компанії активно нарощують свої потужності у сфері ШІ, отримуючи значну підтримку від держави.
Експерти відзначають, що впровадження механізмів розрідженої уваги є ключовим напрямком розвитку великих мовних моделей. Запуск DeepSeek-V3.2-Exp та значне зниження цін на API свідчать про прагнення компанії зробити передові ШІ-рішення не лише ефективнішими, але й значно доступнішими, що відкриває нові горизонти для розробників та сприяє загальному прогресу в галузі штучного інтелекту.