OpenAI 最近更新了其 AI 代理开发工具,重点是扩展平台兼容性并改进语音界面功能。 这些增强旨在促进为实际应用创建更实用、可控和可审计的 AI 代理。
Agents SDK 现在以 TypeScript 提供,从而扩展了对 JavaScript 和 Node.js 开发人员的支持。 这使 SDK 与现代 Web 和云原生应用程序堆栈保持一致,从而可以在前端和后端环境中部署代理。 TypeScript SDK 镜像了 Python 版本的特性,包括对移交、防护栏、跟踪和模型上下文协议 (MCP) 的支持。
RealtimeAgents 通过音频输入/输出、有状态交互和专为语音应用设计的中断处理来扩展 Agents SDK。 人工参与 (HITL) 审批允许开发人员拦截代理执行以进行手动确认,这对于监督和合规性至关重要。 OpenAI 还更新了其语音到语音模型,以减少延迟并提高实时音频交互的自然度。 更新后的模型在 Realtime API 中以 gpt-4o-realtime-preview-2025-06-03 提供,在 Chat Completions API 中以 gpt-4o-audio-preview-2025-06-03 提供。