OpenAI ha recentemente aggiornato i suoi strumenti di sviluppo di agenti AI, concentrandosi sull'espansione della compatibilità della piattaforma e sul miglioramento delle capacità dell'interfaccia vocale. Questi miglioramenti mirano a facilitare la creazione di agenti AI più pratici, controllabili e verificabili per applicazioni nel mondo reale.
L'SDK Agents è ora disponibile in TypeScript, estendendo il supporto agli sviluppatori JavaScript e Node.js. Ciò allinea l'SDK con gli stack di applicazioni web e cloud-native moderni, consentendo la distribuzione di agenti in ambienti frontend e backend. L'SDK TypeScript rispecchia le funzionalità della versione Python, incluso il supporto per handoff, guardrail, tracciamento e il Model Context Protocol (MCP).
RealtimeAgents estende l'SDK Agents con input/output audio, interazioni stateful e gestione delle interruzioni progettate specificamente per applicazioni vocali. L'approvazione human-in-the-loop (HITL) consente agli sviluppatori di intercettare l'esecuzione dell'agente per la conferma manuale, il che è fondamentale per la supervisione e la conformità. OpenAI ha anche aggiornato il suo modello speech-to-speech per ridurre la latenza e migliorare la naturalezza delle interazioni audio in tempo reale. Il modello aggiornato è disponibile come gpt-4o-realtime-preview-2025-06-03 nell'API Realtime e gpt-4o-audio-preview-2025-06-03 nell'API Chat Completions.