OpenAIは最近、プラットフォームの互換性を拡大し、音声インターフェース機能を改善することに焦点を当てて、AIエージェント開発ツールを更新しました。これらの機能強化は、現実世界のアプリケーション向けにより実用的で、制御可能で、監査可能なAIエージェントの作成を容易にすることを目的としています。
Agents SDKがTypeScriptで利用可能になり、JavaScriptおよびNode.js開発者へのサポートが拡張されました。これにより、SDKは最新のWebおよびクラウドネイティブアプリケーションスタックと連携し、フロントエンドとバックエンドの両方の環境全体でエージェントの展開が可能になります。TypeScript SDKは、ハンドオフ、ガードレール、トレース、およびモデルコンテキストプロトコル(MCP)のサポートなど、Pythonバージョンの機能を反映しています。
RealtimeAgentsは、音声アプリケーション向けに特別に設計されたオーディオ入出力、ステートフルなインタラクション、および割り込み処理を使用して、Agents SDKを拡張します。Human-in-the-loop(HITL)承認により、開発者は手動で確認するためにエージェントの実行を傍受できます。これは、監督とコンプライアンスにとって非常に重要です。OpenAIはまた、遅延を短縮し、リアルタイムオーディオインタラクションの自然さを向上させるために、音声合成モデルを更新しました。更新されたモデルは、Realtime APIでgpt-4o-realtime-preview-2025-06-03として、Chat Completions APIでgpt-4o-audio-preview-2025-06-03として利用できます。