字节跳动发布Seed-OSS-36B:一款具有512K词元上下文的突破性开源大语言模型

编辑者: Veronika Radoslavskaya

字节跳动(TikTok母公司)于2025年8月20日宣布推出其最新的开源大型语言模型(LLM)Seed-OSS-36B,此举标志着人工智能领域的一项重大进展。该模型凭借其原生512,000词元的超长上下文窗口和创新的“思考预算”机制,为开发者提供了一个强大且灵活的替代方案,旨在推动人工智能的普及与创新。

Seed-OSS-36B的核心亮点之一是其高达512K的原生上下文处理能力。这一特性使其能够一次性处理海量信息,无论是深度分析法律文档、研究报告,还是理解复杂的代码库,都展现出前所未有的效率和深度。与目前主流的开源模型相比,其上下文窗口容量是其两倍,为处理长文本和复杂任务提供了坚实基础。此外,该模型引入了“思考预算”功能,允许开发者精细控制模型的推理深度和计算资源分配。这一机制旨在平衡性能与成本,优化资源利用,避免不必要的计算开销,从而在效率和成本效益之间找到最佳点。

在性能表现上,Seed-OSS-36B在多项基准测试中取得了令人瞩目的成绩。其MMLU-Pro得分为65.1,超越了竞争对手阿里巴巴的58.5;在BBH基准测试中,其87.7的得分更是刷新了开源模型的记录,显示出其在推理能力上的卓越表现。GSM8K和MATH基准测试得分分别为90.8和81.7,HumanEval得分为76.8,这些数据共同证明了Seed-OSS-36B在通用能力、数学推理和代码生成等多个维度上的强大实力。

字节跳动将Seed-OSS-36B以Apache-2.0许可协议开源,这意味着全球的开发者和研究人员可以自由地使用、修改和分发该模型,极大地促进了AI技术的民主化和社区协作。此举也反映了当前人工智能领域开源策略的兴起,通过开放技术生态,字节跳动不仅巩固了其在AI领域的地位,也为整个行业注入了新的活力。开源模式正日益成为推动AI发展的重要力量,它鼓励了更广泛的参与和更快的迭代,使得先进的AI能力能够触及更广泛的群体,赋能更多创新。

字节跳动Seed团队自2023年成立以来,一直致力于探索通用人工智能的新途径,并推动AI技术的边界。Seed-OSS-36B的发布,不仅是该团队技术实力的体现,更是其对AI未来发展愿景的承诺。通过提供这样一款高性能、长上下文且易于使用的开源模型,字节跳动正积极赋能全球开发者社区,鼓励他们探索AI的无限可能,共同塑造一个更加智能化的未来。这一里程碑式的发布,预示着一个更加开放、协作和充满活力的AI新时代的到来,为各行各业的创新应用打开了新的大门。

来源

  • News Directory 3

  • VentureBeat

  • AInvest

  • 36Kr

  • Communeify

  • Hugging Face

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。