OpenAI、TypeScript SDK、リアルタイム音声機能、および2025年6月の改善された音声モデルでAIエージェント開発を強化

編集者: gaya ❤️ one

OpenAIは最近、プラットフォームの互換性を拡大し、音声インターフェース機能を改善することに焦点を当てて、AIエージェント開発ツールを更新しました。これらの機能強化は、現実世界のアプリケーション向けにより実用的で、制御可能で、監査可能なAIエージェントの作成を容易にすることを目的としています。

Agents SDKがTypeScriptで利用可能になり、JavaScriptおよびNode.js開発者へのサポートが拡張されました。これにより、SDKは最新のWebおよびクラウドネイティブアプリケーションスタックと連携し、フロントエンドとバックエンドの両方の環境全体でエージェントの展開が可能になります。TypeScript SDKは、ハンドオフ、ガードレール、トレース、およびモデルコンテキストプロトコル(MCP)のサポートなど、Pythonバージョンの機能を反映しています。

RealtimeAgentsは、音声アプリケーション向けに特別に設計されたオーディオ入出力、ステートフルなインタラクション、および割り込み処理を使用して、Agents SDKを拡張します。Human-in-the-loop(HITL)承認により、開発者は手動で確認するためにエージェントの実行を傍受できます。これは、監督とコンプライアンスにとって非常に重要です。OpenAIはまた、遅延を短縮し、リアルタイムオーディオインタラクションの自然さを向上させるために、音声合成モデルを更新しました。更新されたモデルは、Realtime APIでgpt-4o-realtime-preview-2025-06-03として、Chat Completions APIでgpt-4o-audio-preview-2025-06-03として利用できます。

ソース元

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。