OpenAI 正式发布 GPT-5.4:原生计算机控制功能与金融领域深度集成开启新纪元
编辑者: Veronika Radoslavskaya
2026年3月初,OpenAI 官方宣布推出其最先进的通用大模型 GPT-5.4,这标志着人工智能正从传统的对话模式向具备自主能力的智能体工作流及直接软件操作进行战略转型。这一全新迭代版本不仅统一了极其复杂的逻辑推理能力,还继承了 GPT-5.3-Codex 的卓越编程基因,并在 GPT-5.4 Thinking 和 GPT-5.4 Pro 两个变体中引入了开创性的原生计算机使用功能。
该模型最核心的进化在于其具备原生操控计算机的能力,能够实时解析屏幕截图,并利用 Playwright 等自动化库直接发出虚拟鼠标点击和键盘输入指令。在 OSWorld-Verified 基准测试中,GPT-5.4 展现了惊人的实力,取得了 75.0% 的成功率,这一成绩不仅超越了 72.4% 的人类基准线,更大幅领先于 GPT-5.2 此前 47.3% 的记录。此外,新模型的可靠性也得到了量化提升:数据显示,其单项事实陈述的错误率比 GPT-5.2 降低了 33%,而完整响应中的整体错误则减少了 18%。
在市场布局上,此次发布重点聚焦于高价值的企业级应用,特别是通过深度嵌入金融软件生态系统来实现业务增长。其中包括了 ChatGPT for Excel 的 Beta 版本发布,该功能以侧边栏插件的形式集成在软件中。金融专业人士现在可以利用自然语言来构建、审计以及更新复杂的财务模型,AI 能够将操作指令直接链接至特定的单元格,并在执行任何实质性更改前请求用户确认,确保了金融决策的严谨性。
此外,GPT-5.4 专为关键的机构数据整合而设计,能够协助将市场实时行情、公司监管备案文件及深度研究报告无缝融入估值与承销的工作流中。对于开发者群体,API 现在支持高达 100 万个 token 的超长上下文窗口,这意味着可以一次性导入整个代码库或海量的技术文档。需要注意的是,当输入超过 272,000 个 token 时将适用双倍计费标准。为了平衡计算规模与成本,OpenAI 在 API 中引入了“工具搜索”(Tool Search)功能,测试表明该功能在处理复杂工具调用任务时,可有效减少约 47% 的总 token 消耗。
在通用知识工作方面,GPT-5.4 在涵盖 44 个职业类别的 GDPval 基准测试中达到了 83.0% 的成功率,显著优于 GPT-5.2 的 71.0%。这一性能的飞跃无疑加剧了 OpenAI 与 Anthropic 等竞争对手在金融科技领域的角逐。在定价策略上,GPT-5.4 Thinking API 的输入价格设定为每百万 token 2.50 美元,输出价格为每百万 token 15 美元,而 GPT-5.4 Pro 版本的费用则更高。OpenAI 认为,模型在 token 使用效率上的提升将抵消单价上涨带来的成本增加,而原有的 GPT-5.2 Thinking 模型预计将在 2026 年内逐步退出市场。
4 查看
来源
WinBuzzer
OpenAI. GPT-5.4 Targets Anthropic's Claude With Premium Pricing and Coding Muscle
GPT-5.4 - Wikipedia
GPT-5.4 API Officially Launched: 1 Million Token Context Window, Native Computer Control, and 5 Core Capabilities Explained - Apiyi.com Blog
No Week Without a Major Release: OpenAI's GPT-5.4 Elevates AI Autonomy and Agency
阅读更多关于该主题的新闻:
anthropic just made switching to claude stupidly easy they launched a "import memory" feature that lets you copy your entire memory from chatgpt (or gemini, whatever) into claude here's how it works (takes like 60 seconds): 1. go to claude . com /import-memory 2. copy the
你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。


