DeepSeek推出实验性AI模型DeepSeek-V3.2-Exp,大幅降低API价格

编辑者: Татьяна Гуринович

中国人工智能公司DeepSeek于2025年9月29日宣布推出其最新的实验性AI模型DeepSeek-V3.2-Exp。该模型在处理长文本序列方面效率显著提升,并伴随其开发者API价格的“50%以上”的降幅,旨在提供更易获取且先进的解决方案。此次发布标志着DeepSeek在模型架构创新和市场策略上的积极布局。

DeepSeek-V3.2-Exp基于其V3.1-Terminus模型构建,核心创新在于引入了“DeepSeek稀疏注意力”(DSA)机制。这项技术首次实现了细粒度的稀疏注意力,有效解决了传统Transformer架构在处理长文本时面临的计算和内存瓶颈。与V3.1-Terminus相比,V3.2-Exp在保持相似输出质量的同时,显著提升了训练和推理效率,尤其在长文本处理场景下,计算成本和内存使用量均大幅降低。DeepSeek将此模型定位为“迈向下一代架构的中间步骤”,为未来的技术发展奠定了基础。

此次API价格的大幅削减预计将为开发者和企业带来显著的成本优势。DeepSeek表示,在缓存命中率较高的情况下,输入成本可降低70-80%,即使在缓存未命中时,成本也比大多数竞争对手低50%以上。这种成本效益的提升不仅降低了开发者的门槛,也可能加速人工智能技术的广泛应用和创新。例如,在检索增强生成(RAG)等应用中,成本的大幅降低使得处理海量数据和进行更频繁的迭代成为可能。

DeepSeek的这一策略调整正值全球人工智能领域竞争日益激烈之际。中国在人工智能领域的快速发展正逐步缩小与美国的差距。Hugging Face等AI模型分享和讨论平台见证了此类技术进步的快速传播。DeepSeek的举措,特别是其对长文本处理能力的提升和API价格的降低,预示着其将在市场中扮演更重要的角色,并可能对国内外竞争对手构成压力。其对长文本序列处理的优化,也契合了当前AI应用中对处理海量信息日益增长的需求。

此次发布不仅展示了DeepSeek在模型架构上的持续探索,也体现了其在市场策略上的积极布局。通过提供更高效、更经济的AI工具,DeepSeek正努力吸引更广泛的开发者社区,并有望在快速演进的人工智能领域占据更有利的位置。

来源

  • Valor Econômico

  • DeepSeek API Docs

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。