DeepSeek представляет новую модель V3.2-Exp и снижает цены на API более чем на 50%

Отредактировано: Татьяна Гуринович

Китайский разработчик искусственного интеллекта DeepSeek объявил о выпуске своей новой экспериментальной модели DeepSeek-V3.2-Exp, которая отличается повышенной эффективностью при работе с длинными текстовыми последовательностями. Одновременно компания значительно снизила цены на свой API для разработчиков более чем на 50%, стремясь укрепить свои позиции на рынке и сделать передовые решения более доступными.

Модель DeepSeek-V3.2-Exp является развитием предыдущей версии V3.1-Terminus и представляет собой важный шаг на пути к архитектуре следующего поколения. Ключевым нововведением является технология DeepSeek Sparse Attention (DSA), которая позволяет модели избирательно обрабатывать наиболее релевантные части длинных текстов. Это значительно снижает вычислительные затраты и потребление памяти, что особенно важно для задач, требующих анализа больших объемов информации. Несмотря на усовершенствования в механизме внимания, качество выходных данных модели остается на уровне предыдущей версии V3.1-Terminus, что подтверждается независимыми тестами, такими как MMLU-Pro, где обе модели показали одинаковый результат в 85.0 баллов. На задачах программирования V3.2-Exp даже продемонстрировала небольшое превосходство.

Снижение цен на API более чем на 50% является стратегическим шагом DeepSeek для привлечения более широкого круга разработчиков и компаний. По данным компании, при высокой частоте попадания в кэш стоимость может снизиться на 70-80%, а даже при промахах в кэше цены остаются на 50% ниже, чем у многих конкурентов. Это делает передовые ИИ-решения более доступными для стартапов и малого бизнеса, способствуя ускорению инноваций в различных отраслях. Аналитики отмечают, что такое снижение цен может существенно повлиять на конкурентную среду, бросая вызов таким гигантам, как OpenAI и Anthropic.

DeepSeek активно поддерживает сообщество разработчиков, предоставляя открытый доступ к коду для инференса и оптимизированным CUDA-ядрам. Модель доступна на различных платформах, включая Hugging Face, где разработчики могут найти не только саму модель, но и обсудить ее применение с другими специалистами. Открытость и доступность модели способствуют ее более широкому внедрению и развитию экосистемы вокруг нее. Это соответствует общей тенденции в индустрии ИИ, где открытые модели и сообщества играют все более важную роль в ускорении прогресса.

Выпуск DeepSeek-V3.2-Exp и значительное снижение цен на API подчеркивают стремление DeepSeek к демократизации доступа к передовым технологиям искусственного интеллекта. Компания демонстрирует, что высокая производительность и эффективность могут быть достигнуты при значительно меньших затратах, что открывает новые возможности для разработчиков и бизнеса по всему миру. Это событие является важным шагом в развитии ИИ, особенно в области обработки длинных текстов, и способствует дальнейшей конкуренции на глобальном рынке.

Источники

  • Valor Econômico

  • DeepSeek API Docs

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.