A OpenAI atualizou recentemente suas ferramentas de desenvolvimento de agentes de IA, com foco na expansão da compatibilidade da plataforma e na melhoria dos recursos da interface de voz. Essas melhorias visam facilitar a criação de agentes de IA mais práticos, controláveis e auditáveis para aplicações do mundo real.
O SDK de Agentes agora está disponível em TypeScript, estendendo o suporte para desenvolvedores JavaScript e Node.js. Isso alinha o SDK com as pilhas de aplicativos web e nativas da nuvem modernas, permitindo a implantação de agentes em ambientes frontend e backend. O SDK TypeScript espelha os recursos da versão Python, incluindo suporte para handoffs, guardrails, rastreamento e o Protocolo de Contexto do Modelo (MCP).
O RealtimeAgents estende o SDK de Agentes com entrada/saída de áudio, interações com estado e tratamento de interrupções projetados especificamente para aplicativos de voz. A aprovação humana no loop (HITL) permite que os desenvolvedores interceptem a execução do agente para confirmação manual, o que é crucial para supervisão e conformidade. A OpenAI também atualizou seu modelo de fala para fala para reduzir a latência e melhorar a naturalidade das interações de áudio em tempo real. O modelo atualizado está disponível como gpt-4o-realtime-preview-2025-06-03 na API Realtime e gpt-4o-audio-preview-2025-06-03 na API Chat Completions.