ByteDance представляє Seed-OSS-36B: революційний LLM з відкритим кодом та контекстом 512K

Відредаговано: Veronika Radoslavskaya

Компанія ByteDance, відома своєю платформою TikTok, зробила значний крок у сфері штучного інтелекту, випустивши нову велику мовну модель (LLM) з відкритим кодом — Seed-OSS-36B. Модель, представлена 20 серпня 2025 року, вирізняється надзвичайно великим контекстним вікном у 512 000 токенів та інноваційним механізмом "бюджету мислення", що дозволяє розробникам контролювати глибину міркувань моделі. Seed-OSS-36B позиціонується як потужна альтернатива пропрієтарним моделям, що має на меті стимулювати інновації в галузі ШІ.

Seed-OSS-36B доступна у трьох варіантах: seed-36b-base (синтетичний), seed-36b-base (несинтетичний) та seed-36b-instruct. Синтетичний варіант демонструє вищі показники у бенчмарках, зокрема, досяг 65,1 бала за шкалою MMLU-Pro, перевершивши показник Alibaba у 58,5 бала. Інші видатні результати включають 82,1 бала за TriviaQA, рекордні 87,7 бала за бенчмарком BBH для моделей з відкритим кодом, 90,8 бала за GSM8K та 81,7 бала за MATH. У сфері кодування модель показала 76,8 бала за HumanEval.

Випуск Seed-OSS-36B підкреслює стратегію ByteDance щодо використання екосистеми відкритого програмного забезпечення для конкуренції з провідними гравцями, такими як OpenAI та Google. На відміну від закритих підходів, які часто використовують американські компанії, китайські розробники все частіше звертаються до прозорості для масштабування своїх екосистем. Відкритий підхід сприяє розвитку спільнот розробників, прискорює впровадження та пропонує бізнесу практичні інструменти за нижчими цінами. Це також відповідає загальній тенденції у 2025 році, коли відкриті моделі, такі як Llama 3.1 від Meta та Qwen від Alibaba, набирають обертів, пропонуючи гнучкість та уникнення прив'язки до постачальника.

Надзвичайно велике контекстне вікно у 512K токенів дозволяє Seed-OSS-36B обробляти та розуміти значно більші обсяги інформації порівняно з попередніми моделями, що є критично важливим для таких завдань, як аналіз довгих документів, складних кодових баз та ведення тривалих діалогів. Механізм "бюджету мислення" додає новий рівень контролю, дозволяючи користувачам динамічно регулювати глибину міркувань моделі, що оптимізує співвідношення між вартістю, затримкою та якістю результату. Це робить модель особливо привабливою для розробників, які створюють складні додатки, що потребують глибокого розуміння контексту.

Модель ліцензована за Apache-2.0, що дозволяє вільне використання, модифікацію та розповсюдження як для дослідницьких, так і для комерційних цілей. Це сприяє демократизації доступу до передових технологій ШІ та прискорює інновації в різних галузях. ByteDance, таким чином, зміцнює свої позиції на ринку ШІ, пропонуючи потужний інструмент, який може трансформувати розробку ШІ-додатків.

Джерела

  • News Directory 3

  • VentureBeat

  • AInvest

  • 36Kr

  • Communeify

  • Hugging Face

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.