ByteDance prezentuje Seed-OSS-36B: przełomowy model LLM z otwartym kodem i kontekstem 512K

Edytowane przez: Veronika Radoslavskaya

Firma ByteDance, znana na całym świecie jako właściciel platformy TikTok, ogłosiła 20 sierpnia 2025 roku wprowadzenie na rynek Seed-OSS-36B – innowacyjnego, otwartego modelu językowego (LLM). Model ten wyróżnia się natywnym oknem kontekstowym o długości 512 000 tokenów oraz mechanizmem "budżetu myślowego", który pozwala na precyzyjną kontrolę głębokości rozumowania.

Seed-OSS-36B, opracowany przez zespół Seed Team firmy ByteDance, jest dostępny na platformach Hugging Face i GitHub na licencji Apache-2.0, co umożliwia swobodne wykorzystanie, modyfikację i redystrybucję w celach badawczych i komercyjnych. Model występuje w trzech wariantach: seed-36b-base (z danymi syntetycznymi), seed-36b-base (bez danych syntetycznych) oraz seed-36b-instruct. Wariant z danymi syntetycznymi osiągnął lepsze wyniki w testach porównawczych.

Model wykazał imponujące rezultaty w benchmarkach, uzyskując 65,1 w MMLU-Pro (przewyższając konkurencyjny model Alibaba z wynikiem 58,5) oraz rekordowe 87,7 w BBH dla modeli z otwartym kodem źródłowym. Seed-OSS-36B osiągnął również wysokie wyniki w testach TriviaQA (82,1), GSM8K (90,8), MATH (81,7) i HumanEval (76,8).

Mechanizm "budżetu myślowego" pozwala na optymalizację zasobów obliczeniowych i dostosowanie działania AI do specyficznych zadań, podobnie jak w modelach Google Gemini. Długie okno kontekstowe 512 000 tokenów umożliwia przetwarzanie i analizę znacznie większych ilości danych, co jest kluczowe przy pracy z obszernymi dokumentami czy kodem. Wprowadzenie Seed-OSS-36B przez ByteDance umacnia pozycję firmy jako kluczowego gracza na globalnym rynku sztucznej inteligencji i wspiera społeczność open-source.

Źródła

  • News Directory 3

  • VentureBeat

  • AInvest

  • 36Kr

  • Communeify

  • Hugging Face

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.