Anthropic Claude Haiku 4.5 引爆AI价格战,以近前沿性能实现技术普及化

作者: Veronika Radoslavskaya

Anthropic 近期发布的 Claude Haiku 4.5 模型,标志着人工智能经济学领域的一个重大转折点,它彻底重新定义了尖端能力的价值。这款新模型提供的性能水平,与仅仅五个月前 Claude Sonnet 4 所设定的标准相当,但成本大幅降低,运行速度显著提升。Haiku 4.5 于 2025 年 10 月 15 日问世,它不再仅仅是一个渐进式的更新,而是清晰地展示了突破性技术如何迅速转变为基线预期,从而快速重塑企业级 AI 架构。

性能指标证实了这一戏剧性的转变。在 SWE-bench Verified 基准测试中,Claude Haiku 4.5 取得了 73.3% 的得分,这与此前被视为最先进的模型(包括早期版本的 Claude Sonnet 4、OpenAI 的 GPT-5 和 Google 的 Gemini 2.5 Pro)在软件工程任务中的表现持平或超越。尽管能力强大,但其定价却惊人的低廉:输入每百万 Token 仅需 1 美元,输出每百万 Token 仅需 5 美元。这与 Sonnet 4 此前每百万 Token 输入 3 美元、输出 15 美元的结构形成了鲜明对比。

值得注意的是,Haiku 4.5 的运行速度比其更昂贵的同系列模型 Sonnet 4.5 快四到五倍,甚至在直接软件界面控制等特定应用中表现更优。这种价值的快速贬值反映了更广泛的行业趋势,即推理成本在过去一年中估计每年下降了 86%。竞争对手也纷纷效仿:谷歌将 Gemini 1.5 Flash 的输入成本降低了 78%,输出成本降低了 71%;而 OpenAI 则将 GPT-4o 的输入成本减半,输出成本削减了三分之一。Anthropic 通过将 Haiku 4.5 设为所有免费 Claude.ai 用户的默认模型,进一步巩固了这种普及化,让用户即刻获得了近乎前沿的智能体验。

新的格局鼓励了更为复杂的模型编排,预示着一个多模型共存的未来,其中不同层级的模型承担不同的职责。Anthropic 提出了这样的工作流程:像 Sonnet 4.5 这样的高级模型负责处理复杂的战略规划,而大量更快、更便宜的 Haiku 4.5 实例则负责管理并执行并行的子任务。这种架构演变已在现实世界中得到验证;Dan Shipper 创办的 Every 公司,在因运营成本放弃了更昂贵的 Sonnet 4.5 之后,成功地将具有成本效益的 Haiku 4.5 重新整合到其 Cora 邮件助手中。

定价动态的转变迫使价值向技术栈的上层迁移。随着通用智能逐渐成为一种基础设施,溢价价值集中在需要独特深度的领域,例如通过专有数据微调实现的领域专业化,以及集成与编排——即跨模型智能地分配任务。Anthropic 还指出,Haiku 4.5 的“错位行为”(misaligned behaviors)发生率在统计学上显著低于 Sonnet 4.5 和 Opus 4.1,使其成为该公司目前最安全的模型产品。对于组织领导者而言,竞争优势越来越体现在如何智能地将 AI 融入业务运营结构中,以满足真正的客户需求,而非仅仅依赖底层模型的能力。

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。