2025年8月,中国的人工智能领域迎来了一系列重要的创新成果,科技巨头字节跳动(ByteDance)和人工智能初创公司深度求索(DeepSeek)分别发布了其最新的AI模型,这些进展标志着中国在人工智能领域的快速发展及其在技术自主性方面的战略承诺。
全球科技领导者字节跳动推出了其Seed-OSS-36B开源人工智能模型的三个不同版本。此次发布旨在将字节跳动定位为开源AI生态系统的关键贡献者,其模型在设计上兼顾了开发者的易用性和强大的长上下文处理能力。Seed-OSS-36B拥有360亿参数,在基准测试中展现出与国际领先科技公司同等规模模型的竞争性性能。字节跳动对开源开发的侧重,与中国科技行业更广泛的战略相呼应,通过Hugging Face等平台促进了更广泛的应用和创新加速,为市场提供了高性能、可访问的替代方案。
与此同时,深度求索发布了其升级版DeepSeek-V3.1模型,标志着AI架构的一次重大飞跃。该模型拥有庞大的6850亿参数,基于先进的混合专家(MoE)架构构建,每个token约激活370亿参数。其突出特点是拥有128,000个token的超长上下文窗口,能够实现更全面的数据分析和更细致的理解。DeepSeek-V3.1引入了开创性的混合推理设计,无缝集成了“思考”和“非思考”模式,并增强了代理能力和对工具使用的原生支持,使其能够胜任复杂的多步骤操作。
值得注意的是,深度求索专门针对中国制造的半导体芯片优化了V3.1模型,并采用了UE8M0 FP8等格式。这一关键进展直接增强了中国国内半导体产业及其技术主权追求,标志着中国在AI软件和硬件创新协同方面的深化。此外,深度求索的V3.1在成本效益方面表现出色,据报道,其性能可与领先的专有模型相媲美,但成本却低得多,甚至在特定编码基准测试中,以显著降低的运营成本超越了Claude Opus等竞争对手。
这些发布的综合影响有力地证明了中国在人工智能战略上的专注。字节跳动的开源举措实现了对先进AI的普及,培育了充满活力的开发环境;而深度求索的V3.1则展现了中国在尖端AI架构和硬件集成方面的能力。对国内芯片的优化尤为重要,它为中国半导体行业带来了巨大推动,并巩固了中国通过构建有韧性、自给自足的技术基础设施来引领AI的雄心。这些进展不仅是技术上的里程碑,更是战略性的举措,正在重塑全球AI竞争格局,并彰显出中国科技行业日益成熟的影响力。