OpenAI Mejora el Desarrollo de Agentes de IA con el SDK de TypeScript, Funciones de Voz en Tiempo Real y Modelos de Voz Mejorados en Junio de 2025

Editado por: gaya ❤️ one

OpenAI ha actualizado recientemente sus herramientas de desarrollo de agentes de IA, centrándose en la expansión de la compatibilidad de la plataforma y la mejora de las capacidades de la interfaz de voz. Estas mejoras tienen como objetivo facilitar la creación de agentes de IA más prácticos, controlables y auditables para aplicaciones del mundo real.

El SDK de Agents ahora está disponible en TypeScript, lo que extiende el soporte a los desarrolladores de JavaScript y Node.js. Esto alinea el SDK con las pilas de aplicaciones web modernas y nativas de la nube, lo que permite la implementación de agentes en entornos frontend y backend. El SDK de TypeScript refleja las características de la versión de Python, incluido el soporte para transferencias, protecciones, rastreo y el Protocolo de Contexto del Modelo (MCP).

RealtimeAgents extiende el SDK de Agents con entrada/salida de audio, interacciones con estado y manejo de interrupciones diseñados específicamente para aplicaciones de voz. La aprobación humana en el bucle (HITL) permite a los desarrolladores interceptar la ejecución del agente para la confirmación manual, lo cual es crucial para la supervisión y el cumplimiento. OpenAI también ha actualizado su modelo de voz a voz para reducir la latencia y mejorar la naturalidad de las interacciones de audio en tiempo real. El modelo actualizado está disponible como gpt-4o-realtime-preview-2025-06-03 en la API Realtime y gpt-4o-audio-preview-2025-06-03 en la API Chat Completions.

Fuentes

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.