OpenAI 正式發布 GPT-5.4:具備原生電腦操控能力與深度金融系統整合
编辑者: Veronika Radoslavskaya
OpenAI 於 2026 年 3 月初正式宣布推出其最先進的通用人工智慧模型 GPT-5.4,這標誌著 AI 技術發展的一個重大轉折點,將重心從單純的對話互動轉向具備自主執行能力的代理型工作流(agentic workflows)與直接軟體操作。這款新一代模型成功統一了極其複雜的推理邏輯,並完整繼承了 GPT-5.3-Codex 的頂尖程式碼編寫能力。GPT-5.4 家族包含了 GPT-5.4 Thinking 與 GPT-5.4 Pro 兩種主要變體,兩者皆具備了前所未有的原生電腦使用功能,讓 AI 能夠像人類一樣與作業系統進行互動。
這項技術的核心突破在於模型能夠以原生方式操作電腦,透過解讀螢幕截圖並利用 Playwright 等自動化函式庫,精準地發送虛擬滑鼠點擊與鍵盤指令。在權威的 OSWorld-Verified 基準測試中,GPT-5.4 展現了驚人的 75.0% 成功率,這不僅超越了公認的 72.4% 人類基準表現,更比前代 GPT-5.2 的 47.3% 有了跨越式的進步。除了操作能力的提升,GPT-5.4 在可靠性上也設定了新標準;數據指出,其單獨事實陳述的錯誤機率比 GPT-5.2 降低了 33%,而整體回應中的錯誤總數則減少了 18%,大幅提升了企業應用的信任度。
在市場策略方面,OpenAI 將 GPT-5.4 的應用重點放在高價值的企業端,特別是深度滲透至金融軟體生態系中。其中最受矚目的進展是 ChatGPT for Excel 的 Beta 版本發布,該功能以側邊欄增益集的形式直接嵌入試算表軟體。這項整合讓金融專業人士能夠直接使用自然語言來建構、審計或更新極其複雜的財務模型。AI 不僅能理解指令,還能將操作直接連結至特定的儲存格,並在執行任何關鍵變動前,主動要求使用者進行確認,確保了財務作業的嚴謹性與安全性。
此外,GPT-5.4 專為大型機構的數據整合需求而設計,能無縫將即時市場數據、公司監管文件及各類研究報告納入企業的估值與承銷工作流程中。針對開發者社群,新版的 API 現在支援高達 100 萬個標記(tokens)的超長上下文視窗,這意味著開發者可以一次性輸入整個軟體專案的程式碼庫或數百頁的技術文件。雖然在輸入超過 272,000 個標記時會觸發雙倍計費機制,但 OpenAI 同步推出了「工具搜尋」(Tool Search)功能,測試結果顯示,在處理複雜的工具調用任務時,該功能可有效降低約 47% 的標記消耗,優化了運算資源的配置。
在廣泛的知識工作表現上,GPT-5.4 在涵蓋 44 種不同職業類別的 GDPval 基準測試中取得了 83.0% 的成功率,顯著高於 GPT-5.2 的 71.0%。這一系列性能提升無疑加劇了人工智慧市場的競爭,特別是在與 Anthropic 爭奪金融產業主導權的戰場上。在價格體系方面,GPT-5.4 Thinking API 的定價設為每百萬輸入標記 2.50 美元,每百萬輸出標記 15 美元,而 Pro 變體的價格則相對更高。OpenAI 強調,儘管單位價格有所調整,但模型更高的標記效率將能為多數複雜部署節省成本。隨著新模型的普及,舊有的 GPT-5.2 Thinking 模型預計將在 2026 年期間逐步退出市場。
4 浏览量
來源
WinBuzzer
OpenAI. GPT-5.4 Targets Anthropic's Claude With Premium Pricing and Coding Muscle
GPT-5.4 - Wikipedia
GPT-5.4 API Officially Launched: 1 Million Token Context Window, Native Computer Control, and 5 Core Capabilities Explained - Apiyi.com Blog
No Week Without a Major Release: OpenAI's GPT-5.4 Elevates AI Autonomy and Agency
閱讀更多有關此主題的新聞:
anthropic just made switching to claude stupidly easy they launched a "import memory" feature that lets you copy your entire memory from chatgpt (or gemini, whatever) into claude here's how it works (takes like 60 seconds): 1. go to claude . com /import-memory 2. copy the
发现错误或不准确的地方吗?我们会尽快处理您的评论。


