OpenAI a récemment mis à jour ses outils de développement d'agents IA, en se concentrant sur l'expansion de la compatibilité de la plateforme et l'amélioration des capacités d'interface vocale. Ces améliorations visent à faciliter la création d'agents IA plus pratiques, contrôlables et auditables pour des applications concrètes.
Le SDK Agents est désormais disponible en TypeScript, étendant la prise en charge aux développeurs JavaScript et Node.js. Cela aligne le SDK sur les piles d'applications web et natives du cloud modernes, permettant le déploiement d'agents dans les environnements frontend et backend. Le SDK TypeScript reflète les fonctionnalités de la version Python, y compris la prise en charge des transferts, des garde-fous, du traçage et du protocole de contexte de modèle (MCP).
RealtimeAgents étend le SDK Agents avec l'entrée/sortie audio, les interactions avec état et la gestion des interruptions, spécialement conçues pour les applications vocales. L'approbation par l'humain dans la boucle (HITL) permet aux développeurs d'intercepter l'exécution de l'agent pour une confirmation manuelle, ce qui est crucial pour la surveillance et la conformité. OpenAI a également mis à jour son modèle de parole à parole pour réduire la latence et améliorer le naturel des interactions audio en temps réel. Le modèle mis à jour est disponible sous le nom de gpt-4o-realtime-preview-2025-06-03 dans l'API Realtime et gpt-4o-audio-preview-2025-06-03 dans l'API Chat Completions.