OpenAIがGPT-5.3 Codexをリリース：自己開発による進化と圧倒的なパフォーマンス向上を実現

21:46, 06 2月

編集者： Veronika Radoslavskaya

OpenAIは、これまでで最も高度なエージェント型コーディングシステムである「GPT-5.3 Codex」を正式に発表しました。この最新モデルは、従来のGPT-5.2-Codexが持つ卓越したプログラミング能力と、GPT-5.2ベースモデルの高度な推論能力および専門知識を統合した、強力な統合システムとして構築されています。

特筆すべき点として、GPT-5.3 Codexの初期バージョンは、自身の開発プロセスにおいてOpenAIのエンジニアリングチームを直接サポートしました。トレーニング実行時のデバッグやデプロイのスケールアップ、さらには評価結果の分析といった複雑な工程に貢献しています。単なるコード生成にとどまらず、日常的なコーディング作業の自動化からプロジェクト全体のライフサイクル管理までをこなす、自律的なアシスタントとしての役割を果たします。

パフォーマンス面では、前世代のモデルと比較して処理速度が25%向上しました。独立したテスト結果によると、Terminal-Bench 2.0においてAnthropicのClaude Opus 4.6を上回るスコアを記録しています。特に、実際のターミナル操作やコマンド実行、エラーハンドリングの正確性において、非常に高い評価を得ています。

コンピュータ操作の習熟度を測定するOSWorldベンチマークでは、従来のCodexモデルから大幅な進歩を遂げ、初期レポートで60%台半ばのスコアを記録しました。この結果は、AIモデルが単にコードを書くだけでなく、開発プロセス全体のループを完結させる能力を重視する方向へとシフトしていることを示しています。

セキュリティ面においては、OpenAIの「Preparedness Framework（準備フレームワーク）」に基づき、サイバーセキュリティ分野で「高い（High）」能力を持つと分類されました。これにより、防御的なセキュリティ研究へのサポートが強化されています。また、SWE-Bench Proの初期スコアは約56.8%に達しており、特に実行速度の面で他のモデルをリードしています。

ユーザーインターフェースの革新として、実行中のインタラクティブなステアリング（操作誘導）が可能になりました。これにより、ユーザーは作業のコンテキストを維持したまま、途中でAIに指示を与えることができます。これは、長期的なタスクにおける継続性の問題を解決するもので、競合他社が重視する深い自律計画とは対照的なアプローチです。さらに、macOS専用の新しいCodexアプリが、AIエージェントを指揮するコントロールセンターとして提供されます。

現在、この新モデルはChatGPTの有料プランを利用している全ユーザーに向けて展開が始まっています。開発者のワークフローにシームレスに統合されることを最優先事項として設計されており、日々の業務効率を劇的に改善することが期待されています。

競合環境に目を向けると、今回のリリースは、深い推論能力と100万トークンのコンテキストウィンドウを特徴とするAnthropicのClaude Opus 4.6に対抗する形となります。GPT-5.3 Codexは、テストスイートの生成から引き継ぎドキュメントの作成に至るまで、あらゆる専門的なコンピュータタスクを網羅し、開発者の日常的なルーチンを根本から変革しようとしています。

OpenAI

GPT-5.3 Codex

Agentic AI

Claude Opus

2 ビュー

ソース元

WWWhat's new
The Week AI Broke Wall Street and the Gloves Came Off
OpenAI releases GPT-5.3-Codex, a coding model that helped build itself - Mashable
Our complete GPT 5.3 Codex review: A new era for agentic AI - eesel AI
OpenAI, Anthropic fight on the frontier - The Rundown AI
Introducing Claude Opus 4.6 - Anthropic

このトピックに関するさらに多くのニュースを読む:

06 2月

快手（Kuaishou）、統合マルチモーダル・アーキテクチャとネイティブ音声機能を備えた「Kling AI 3.0」を発表

05 2月

AnthropicがClaude Opus 4.6を発表：エージェントチーム機能と100万トークンのコンテキストを搭載

04 2月

Google DeepMind、Gemini 3 Flashにエージェント的視覚を統合し画像理解を向上

エラーや不正確な情報を見つけましたか？できるだけ早くコメントを考慮します。