Компания ByteDance, владелец TikTok, представила свою новую модель больших языков (LLM) с открытым исходным кодом — Seed-OSS-36B. Релиз состоялся 20 августа 2025 года и позиционирует ByteDance как значимого игрока на рынке ИИ.
Seed-OSS-36B отличается нативным контекстным окном в 512 000 токенов, что значительно превосходит возможности большинства существующих LLM. Это позволяет модели обрабатывать огромные объемы информации за один проход, что делает ее идеальной для анализа длинных документов, сложных кодовых баз и многоэтапных диалогов. Модель также оснащена гибким механизмом «бюджета мышления», позволяющим разработчикам контролировать глубину рассуждений и балансировать между вычислительными затратами и качеством вывода.
Производительность Seed-OSS-36B подтверждается впечатляющими результатами в различных тестах. Модель продемонстрировала превосходство над конкурентами аналогичного масштаба, такими как модели от Alibaba Cloud, Google и OpenAI, в таких областях, как понимание знаний, математика и кодирование. В частности, Seed-OSS-36B установила новый рекорд для моделей с открытым исходным кодом в тесте BBH на рассуждение, достигнув показателя 87,7. Другие ключевые показатели включают MMLU-Pro — 65,1, TriviaQA — 82,1, GSM8K — 90,8, MATH — 81,7 и HumanEval — 76,8. Эти результаты подчеркивают эффективность и мощность модели, несмотря на ее 36 миллиардов параметров.
ByteDance выпустила три варианта Seed-OSS-36B: seed-36b-base (с синтетическими данными), seed-36b-base (без синтетических данных) и seed-36b-instruct. Вариант с синтетическими данными показывает более высокие результаты в тестах, в то время как версия без синтетических данных предлагает более «чистую» основу для исследований. Модель распространяется под лицензией Apache-2.0, разрешающей свободное использование, модификацию и распространение как в исследовательских, так и в коммерческих целях. Этот шаг ByteDance подчеркивает ее приверженность открытому исходному коду для ускорения инноваций и создания более широкой экосистемы разработчиков.
Выпуск Seed-OSS-36B является частью более широкой стратегии ByteDance по укреплению своих позиций в области ИИ. Компания активно инвестирует в исследования и разработки, привлекая ведущих специалистов и создавая собственную инфраструктуру. Этот шаг также отражает растущее влияние китайских технологических компаний на глобальном рынке ИИ, где открытый исходный код становится все более важным инструментом для конкуренции с лидерами отрасли.