A ByteDance, gigante por trás do TikTok, anunciou em 20 de agosto de 2025 o lançamento do Seed-OSS-36B, um modelo de linguagem grande (LLM) de código aberto. Este modelo destaca-se pela sua capacidade de processar um contexto de 512.000 tokens, uma extensão sem precedentes que permite a análise de vastas quantidades de informação de uma só vez, posicionando a ByteDance como uma força a ser reconhecida no cenário global de IA.
O Seed-OSS-36B introduz um inovador mecanismo de "orçamento de pensamento" (thinking budget), que permite aos desenvolvedores controlar a profundidade do raciocínio do modelo através da alocação de um número específico de tokens. Esta flexibilidade otimiza a eficiência da inferência em aplicações práticas, adaptando o modelo a tarefas de complexidade variada.
A ByteDance disponibilizou três variantes do modelo: seed-36b-base (com dados sintéticos), seed-36b-base (sem dados sintéticos) e seed-36b-instruct. A versão com dados sintéticos demonstrou um desempenho superior em benchmarks, enquanto a variante sem dados sintéticos oferece uma base mais pura para pesquisas e ajustes finos.
O desempenho do Seed-OSS-36B foi validado em diversos benchmarks, alcançando 65.1 no MMLU-Pro, 82.1 no TriviaQA, 87.7 no BBH (um novo recorde para modelos de código aberto), 90.8 no GSM8K, 81.7 no MATH e 76.8 no HumanEval. Estas métricas sublinham a robustez e versatilidade do modelo, apresentando-o como uma alternativa poderosa aos modelos proprietários.
O lançamento do Seed-OSS-36B sob a licença Apache-2.0 democratiza o acesso a tecnologia de ponta, permitindo o uso, modificação e redistribuição gratuitos para fins de pesquisa e comerciais. A ByteDance, através de sua Seed Team, reafirma seu compromisso com a inovação aberta, com o modelo disponível no Hugging Face e GitHub para facilitar a adoção e experimentação global.