2026年3月初旬、OpenAIは次世代の汎用AIモデル「GPT-5.4」のリリースを正式に発表しました。この最新モデルの登場は、AIが単なる対話型ツールから、ソフトウェアを直接操作し自律的にタスクを遂行する「エージェント指向のワークフロー」へと戦略的に転換したことを象徴しています。GPT-5.4は、高度な推論能力とGPT-5.3-Codexから継承した卓越したコーディング能力を統合しており、特定の用途に合わせて「GPT-5.4 Thinking」および「GPT-5.4 Pro」の2つのバリアントで展開されます。
今回の技術的な目玉は、コンピュータをネイティブに操作できる新機能です。このモデルは画面のスクリーンショットをリアルタイムで解釈し、Playwrightなどのライブラリを介して仮想的なマウス操作やキーボード入力を実行します。OSWorld-Verifiedベンチマークにおけるテストでは、GPT-5.4は75.0%という高い成功率を記録しました。これは人間の基準値である72.4%を上回り、前世代モデルであるGPT-5.2の47.3%という数値を大幅に凌駕する結果です。また、信頼性も向上しており、個別の事実誤認が発生する確率はGPT-5.2と比較して33%低減し、回答全体に含まれるエラーも18%減少しています。
戦略面では、高付加価値なエンタープライズ市場、特に金融ソフトウェアエコシステムへの深い統合に重点が置かれています。その一環として、Excel用ChatGPTのベータ版がサイドバーアドインとして公開されました。この統合により、金融専門家は自然言語を用いて複雑な財務モデルの構築、監査、更新を直接行えるようになります。AIはスプレッドシート内の特定のセルとアクションを紐付け、変更を実行する前には必ずユーザーに確認を求める設計となっており、業務の正確性と安全性が担保されています。
さらに、GPT-5.4は機関投資家レベルのデータ統合を念頭に設計されており、リアルタイムの市場データ、企業の法定開示書類、詳細なリサーチレポートなどを、企業のバリュエーションやアンダーライティングのワークフローに直接組み込むことが可能です。開発者向けのAPI機能も大幅に強化され、最大100万トークンという極めて広いコンテキストウィンドウをサポートしました。これにより、大規模なコードベース全体や膨大なドキュメントを一度に処理できるようになります。なお、27万2000トークンを超える入力分については二重課金が適用されますが、新たに導入された「ツール検索(Tool Search)」機能により、複雑なタスクにおける総トークン使用量を約47%削減することに成功しています。
広範な知的労働における実力は、44の職業カテゴリーを網羅するGDPvalベンチマークで証明されており、GPT-5.2の71.0%を大きく上回る83.0%の成功率を達成しました。このモデルの登場は、特に金融セクターにおいてAnthropicなどの競合他社とのシェア争いを一層激化させることでしょう。価格体系については、GPT-5.4 Thinking APIが入力100万トークンにつき2.50ドル、出力100万トークンにつき15ドルと設定されています。OpenAIは、トークン効率の改善が複雑なシステム運用におけるコスト増を相殺すると説明しており、旧世代となるGPT-5.2 Thinkingモデルについては、2026年を通じて順次廃止される予定です。



