OpenAI 推出 GPT-5.3 Codex:憑藉自主開發實力與效能躍升,重塑開發者工作流
编辑者: Veronika Radoslavskaya
OpenAI 正式發布了其迄今為止最先進的代理式編碼系統——GPT-5.3 Codex。這一全新版本成功融合了 GPT-5.2-Codex 的強大編碼實力,以及 GPT-5.2 基礎模型中深厚的推理能力與專業知識,打造出一個功能統一且強悍的開發核心,旨在為全球開發者提供更具智慧的支援。
在開發過程中,GPT-5.3 Codex 的早期版本便已展現出驚人的實力,它協助 OpenAI 的工程團隊進行訓練運行的除錯、擴展部署規模,並深入分析評估結果,實現了某種程度上的「自我優化」。該模型不僅限於單純的程式碼生成,更能作為自主助理處理多步驟任務,例如自動化日常編碼瑣事以及管理完整的專案生命週期,大幅減輕了工程師的負擔。
效能方面,GPT-5.3 Codex 較前代產品提升了 25% 的運行速度,這對於需要即時反應的開發環境至關重要。在獨立測試中,它在 Terminal-Bench 2.0 上的表現超越了 Claude Opus 4.6,特別是在真實環境的終端使用、複雜指令執行以及自動化錯誤處理等方面,展現出極高的精準度與穩定性。
針對模擬人類操作電腦行為的 OSWorld 基準測試,GPT-5.3 Codex 相較於先前的 Codex 版本取得了顯著的技術突破。初步報告顯示其得分落在 60% 至 70% 之間,這一進步強調了現代 AI 模型正從單純的程式碼撰寫,轉向能夠理解並處理完整軟體開發循環的重大範式轉移。
根據 OpenAI 的備災框架(Preparedness Framework)評估,該模型在網路安全領域被歸類為「高能力」等級,並為防禦性安全研究提供了更廣泛的支持與工具。在 SWE-Bench Pro 測試中,其初步得分約為 56.8%,其中 Codex 在執行速度與邏輯完整性上,均保持著領先競爭對手的地位。
GPT-5.3 Codex 引入了創新的執行中互動式引導功能,讓使用者能在不流失上下文語境的情況下,隨時介入並引導模型的操作方向。這有效解決了長時程任務中常見的連貫性中斷問題,與競爭對手專注於深度自主規劃但缺乏靈活性的策略形成鮮明對比。此外,專為 macOS 設計的新款 Codex 應用程式將作為開發者的指揮中心,讓操控 AI 代理變得更加直覺。
目前,這項強大的工具已全面推送到 ChatGPT 的付費方案中,包含 Plus、Team 與 Enterprise 用戶。OpenAI 的目標是將其無縫整合至現有的開發者工作流程中,優先確保技術人員能獲得流暢、無縫且高效的開發體驗,進而顯著提升軟體開發的產出品質與效率。
此次發布正值 Anthropic 推出 Claude Opus 4.6 之際,後者雖然強調深度推理與高達 100 萬標記(token)的超大上下文視窗,但 GPT-5.3 Codex 則透過擴大應用範疇,致力於處理幾乎所有專業的電腦任務。從自動生成測試套件到撰寫詳盡的專案交接文件,這款模型正在全面轉變開發者的日常作業模式,開啟人機協作的新篇章。
2 浏览量
來源
WWWhat's new
The Week AI Broke Wall Street and the Gloves Came Off
OpenAI releases GPT-5.3-Codex, a coding model that helped build itself - Mashable
Our complete GPT 5.3 Codex review: A new era for agentic AI - eesel AI
OpenAI, Anthropic fight on the frontier - The Rundown AI
Introducing Claude Opus 4.6 - Anthropic
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?我们会尽快处理您的评论。