OpenAI 发布 GPT-5.3 Codex:自研技术驱动性能跨越,重塑开发者工作流

编辑者: Veronika Radoslavskaya

OpenAI 正式推出了其迄今为止最先进的智能编程系统——GPT-5.3 Codex。这一版本的核心在于深度融合了 GPT-5.2-Codex 卓越的编程能力,以及 GPT-5.2 基础模型在逻辑推理和专业知识领域的深厚积淀,从而打造出一个功能统一且极其强大的开发利器。

值得关注的是,GPT-5.3 Codex 的诞生过程充满了“自我进化”的色彩。在其开发阶段,该模型的早期版本便已深度参与到 OpenAI 工程师团队的工作中,协助完成了训练运行的调试、部署规模的扩展以及评估结果的精细分析。这种自循环的开发模式不仅验证了模型的实用性,也为其最终的卓越表现奠定了基础。

如今的 GPT-5.3 Codex 已远超单纯的代码生成工具,它更像是一位能够独立处理多步骤任务的自动化助手。无论是繁琐的日常编码事务,还是涵盖整个项目生命周期的复杂管理工作,该模型都能展现出极高的自主性,帮助开发者从机械性的劳动中解脱出来。

在性能表现上,GPT-5.3 Codex 较其前代产品实现了质的飞跃,运行速度提升了 25%。在 Terminal-Bench 2.0 的独立测试中,它在真实终端使用、命令执行及错误处理等方面的表现均超越了 Claude Opus 4.6,充分展示了其在实际操作环境中的领先地位。

针对模拟人类用户操作计算机的 OSWorld 基准测试,GPT-5.3 Codex 相比旧版 Codex 取得了显著进步。初步报告显示其得分已达到 60% 中段水平。这一成绩的提升标志着 AI 模型正从单纯的代码编写者,向能够掌控整个开发闭环的全能型工具转变。

根据 OpenAI 的“备灾框架”(Preparedness Framework),该模型在网络安全领域被评定为“高能力”级别,并为防御性安全研究提供了更广泛的支持。此外,在 SWE-Bench Pro 测试中,GPT-5.3 Codex 的初步得分约为 56.8%,尤其在执行速度方面保持着行业领先优势。

为了解决长任务处理中的连贯性难题,GPT-5.3 Codex 引入了执行中途的交互式引导功能。与竞争对手侧重于深度自主规划的策略不同,这一创新允许用户在不丢失上下文的情况下实时干预和调整模型行为。同时,专为 macOS 设计的全新 Codex 应用程序也已上线,作为指挥 AI 代理的核心控制中心。

目前,GPT-5.3 Codex 已面向所有 ChatGPT 付费计划用户开放。OpenAI 此次更新的重点在于确保模型能够无缝嵌入开发者的现有工作流中,从而最大化地提升生产力并降低技术门槛。

这一发布时机恰逢 Anthropic 推出强调深度推理及 100 万 token 上下文窗口的 Claude Opus 4.6。然而,GPT-5.3 Codex 通过将应用范围扩展至几乎所有专业的计算机任务——从生成测试套件到编写交接文档——正深刻地改变着开发者的日常工作模式,开启了人机协作的新纪元。

2 查看

来源

  • WWWhat's new

  • The Week AI Broke Wall Street and the Gloves Came Off

  • OpenAI releases GPT-5.3-Codex, a coding model that helped build itself - Mashable

  • Our complete GPT 5.3 Codex review: A new era for agentic AI - eesel AI

  • OpenAI, Anthropic fight on the frontier - The Rundown AI

  • Introducing Claude Opus 4.6 - Anthropic

你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。