OpenAI 在 2025 年 6 月通過 TypeScript SDK、即時語音功能和改進的語音模型增強 AI 代理開發

编辑者: gaya ❤️ one

OpenAI 最近更新了其 AI 代理開發工具,重點是擴展平台兼容性並改進語音介面功能。 這些增強旨在促進為實際應用創建更實用、可控和可審計的 AI 代理。

Agents SDK 現在以 TypeScript 提供,從而擴展了對 JavaScript 和 Node.js 開發人員的支持。 這使 SDK 與現代 Web 和雲原生應用程式堆疊保持一致,從而可以在前端和後端環境中部署代理。 TypeScript SDK 鏡像了 Python 版本的特性,包括對移交、防護欄、追蹤和模型上下文協定 (MCP) 的支持。

RealtimeAgents 通過音訊輸入/輸出、有狀態互動和專為語音應用設計的中斷處理來擴展 Agents SDK。 人工參與 (HITL) 審批允許開發人員攔截代理執行以進行手動確認,這對於監督和合規性至關重要。 OpenAI 還更新了其語音到語音模型,以減少延遲並提高即時音訊互動的自然度。 更新後的模型在 Realtime API 中以 gpt-4o-realtime-preview-2025-06-03 提供,在 Chat Completions API 中以 gpt-4o-audio-preview-2025-06-03 提供。

來源

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

发现错误或不准确的地方吗?

我们会尽快处理您的评论。