OpenAI улучшает разработку AI-агентов с помощью TypeScript SDK, функций голосовой связи в реальном времени и улучшенных речевых моделей в июне 2025 года

Отредактировано: gaya ❤️ one

OpenAI недавно обновила свои инструменты разработки AI-агентов, сосредоточив внимание на расширении совместимости платформы и улучшении возможностей голосового интерфейса. Эти улучшения направлены на облегчение создания более практичных, контролируемых и проверяемых AI-агентов для реальных приложений.

Agents SDK теперь доступен на TypeScript, расширяя поддержку для разработчиков JavaScript и Node.js. Это приводит SDK в соответствие с современными веб- и облачными стеками приложений, позволяя развертывать агентов как во внешних, так и во внутренних средах. TypeScript SDK отражает функции версии Python, включая поддержку передачи, ограждений, трассировки и протокола контекста модели (MCP).

RealtimeAgents расширяет Agents SDK возможностями ввода/вывода звука, взаимодействиями с отслеживанием состояния и обработкой прерываний, специально разработанными для голосовых приложений. Одобрение человеком в цикле (HITL) позволяет разработчикам перехватывать выполнение агента для ручного подтверждения, что имеет решающее значение для надзора и соответствия требованиям. OpenAI также обновила свою модель преобразования речи в речь, чтобы уменьшить задержку и улучшить естественность аудиовзаимодействий в реальном времени. Обновленная модель доступна как gpt-4o-realtime-preview-2025-06-03 в Realtime API и gpt-4o-audio-preview-2025-06-03 в Chat Completions API.

Источники

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.