OpenAI 推出 GPT-5.3 Codex：憑藉自主開發實力與效能躍升，重塑開發者工作流

21:46, 06 二月

编辑者： Veronika Radoslavskaya

iframe { display: none; }

OpenAI 推出 GPT-5.3 Codex：憑藉自主開發實力與效能躍升，重塑開發者工作流

OpenAI 正式發布了其迄今為止最先進的代理式編碼系統——GPT-5.3 Codex。這一全新版本成功融合了 GPT-5.2-Codex 的強大編碼實力，以及 GPT-5.2 基礎模型中深厚的推理能力與專業知識，打造出一個功能統一且強悍的開發核心，旨在為全球開發者提供更具智慧的支援。

在開發過程中，GPT-5.3 Codex 的早期版本便已展現出驚人的實力，它協助 OpenAI 的工程團隊進行訓練運行的除錯、擴展部署規模，並深入分析評估結果，實現了某種程度上的「自我優化」。該模型不僅限於單純的程式碼生成，更能作為自主助理處理多步驟任務，例如自動化日常編碼瑣事以及管理完整的專案生命週期，大幅減輕了工程師的負擔。

效能方面，GPT-5.3 Codex 較前代產品提升了 25% 的運行速度，這對於需要即時反應的開發環境至關重要。在獨立測試中，它在 Terminal-Bench 2.0 上的表現超越了 Claude Opus 4.6，特別是在真實環境的終端使用、複雜指令執行以及自動化錯誤處理等方面，展現出極高的精準度與穩定性。

針對模擬人類操作電腦行為的 OSWorld 基準測試，GPT-5.3 Codex 相較於先前的 Codex 版本取得了顯著的技術突破。初步報告顯示其得分落在 60% 至 70% 之間，這一進步強調了現代 AI 模型正從單純的程式碼撰寫，轉向能夠理解並處理完整軟體開發循環的重大範式轉移。

根據 OpenAI 的備災框架（Preparedness Framework）評估，該模型在網路安全領域被歸類為「高能力」等級，並為防禦性安全研究提供了更廣泛的支持與工具。在 SWE-Bench Pro 測試中，其初步得分約為 56.8%，其中 Codex 在執行速度與邏輯完整性上，均保持著領先競爭對手的地位。

GPT-5.3 Codex 引入了創新的執行中互動式引導功能，讓使用者能在不流失上下文語境的情況下，隨時介入並引導模型的操作方向。這有效解決了長時程任務中常見的連貫性中斷問題，與競爭對手專注於深度自主規劃但缺乏靈活性的策略形成鮮明對比。此外，專為 macOS 設計的新款 Codex 應用程式將作為開發者的指揮中心，讓操控 AI 代理變得更加直覺。

目前，這項強大的工具已全面推送到 ChatGPT 的付費方案中，包含 Plus、Team 與 Enterprise 用戶。OpenAI 的目標是將其無縫整合至現有的開發者工作流程中，優先確保技術人員能獲得流暢、無縫且高效的開發體驗，進而顯著提升軟體開發的產出品質與效率。

此次發布正值 Anthropic 推出 Claude Opus 4.6 之際，後者雖然強調深度推理與高達 100 萬標記（token）的超大上下文視窗，但 GPT-5.3 Codex 則透過擴大應用範疇，致力於處理幾乎所有專業的電腦任務。從自動生成測試套件到撰寫詳盡的專案交接文件，這款模型正在全面轉變開發者的日常作業模式，開啟人機協作的新篇章。

12 浏览量

來源

WWWhat's new
The Week AI Broke Wall Street and the Gloves Came Off
OpenAI releases GPT-5.3-Codex, a coding model that helped build itself - Mashable
Our complete GPT 5.3 Codex review: A new era for agentic AI - eesel AI
OpenAI, Anthropic fight on the frontier - The Rundown AI
Introducing Claude Opus 4.6 - Anthropic

通知中心

OpenAI 推出 GPT-5.3 Codex：憑藉自主開發實力與效能躍升，重塑開發者工作流

來源

阅读更多关于此主题的文章：