OpenAI недавно обновила свои инструменты разработки AI-агентов, сосредоточив внимание на расширении совместимости платформы и улучшении возможностей голосового интерфейса. Эти улучшения направлены на облегчение создания более практичных, контролируемых и проверяемых AI-агентов для реальных приложений.
Agents SDK теперь доступен на TypeScript, расширяя поддержку для разработчиков JavaScript и Node.js. Это приводит SDK в соответствие с современными веб- и облачными стеками приложений, позволяя развертывать агентов как во внешних, так и во внутренних средах. TypeScript SDK отражает функции версии Python, включая поддержку передачи, ограждений, трассировки и протокола контекста модели (MCP).
RealtimeAgents расширяет Agents SDK возможностями ввода/вывода звука, взаимодействиями с отслеживанием состояния и обработкой прерываний, специально разработанными для голосовых приложений. Одобрение человеком в цикле (HITL) позволяет разработчикам перехватывать выполнение агента для ручного подтверждения, что имеет решающее значение для надзора и соответствия требованиям. OpenAI также обновила свою модель преобразования речи в речь, чтобы уменьшить задержку и улучшить естественность аудиовзаимодействий в реальном времени. Обновленная модель доступна как gpt-4o-realtime-preview-2025-06-03 в Realtime API и gpt-4o-audio-preview-2025-06-03 в Chat Completions API.