OpenAI、TypeScript SDK、リアルタイム音声機能、および2025年6月の改善された音声モデルでAIエージェント開発を強化

21:40, 03 6月

編集者： gaya ❤️ one

OpenAIは最近、プラットフォームの互換性を拡大し、音声インターフェース機能を改善することに焦点を当てて、AIエージェント開発ツールを更新しました。これらの機能強化は、現実世界のアプリケーション向けにより実用的で、制御可能で、監査可能なAIエージェントの作成を容易にすることを目的としています。

Agents SDKがTypeScriptで利用可能になり、JavaScriptおよびNode.js開発者へのサポートが拡張されました。これにより、SDKは最新のWebおよびクラウドネイティブアプリケーションスタックと連携し、フロントエンドとバックエンドの両方の環境全体でエージェントの展開が可能になります。TypeScript SDKは、ハンドオフ、ガードレール、トレース、およびモデルコンテキストプロトコル（MCP）のサポートなど、Pythonバージョンの機能を反映しています。

RealtimeAgentsは、音声アプリケーション向けに特別に設計されたオーディオ入出力、ステートフルなインタラクション、および割り込み処理を使用して、Agents SDKを拡張します。Human-in-the-loop（HITL）承認により、開発者は手動で確認するためにエージェントの実行を傍受できます。これは、監督とコンプライアンスにとって非常に重要です。OpenAIはまた、遅延を短縮し、リアルタイムオーディオインタラクションの自然さを向上させるために、音声合成モデルを更新しました。更新されたモデルは、Realtime APIでgpt-4o-realtime-preview-2025-06-03として、Chat Completions APIでgpt-4o-audio-preview-2025-06-03として利用できます。

ソース元

MarkTechPost
OpenAI Developer Community
MarkTechPost

このトピックに関するさらに多くのニュースを読む:

31 7月

AIツールを狙う新たな脅威：ブラウザ拡張機能を悪用した「Man in the Prompt」攻撃の脆弱性

31 7月

xAI、Grokの新機能「Imagine」を発表：テキストから動画生成が可能に

31 7月

OpenAI、ノルウェーにAIデータセンター「Stargate Norway」を設立

エラーや不正確な情報を見つけましたか？

できるだけ早くコメントを考慮します。