OpenAI Aprimora o Desenvolvimento de Agentes de IA com SDK TypeScript, Recursos de Voz em Tempo Real e Modelos de Fala Aprimorados em Junho de 2025

Editado por: gaya ❤️ one

A OpenAI atualizou recentemente suas ferramentas de desenvolvimento de agentes de IA, com foco na expansão da compatibilidade da plataforma e na melhoria dos recursos da interface de voz. Essas melhorias visam facilitar a criação de agentes de IA mais práticos, controláveis ​​e auditáveis ​​para aplicações do mundo real.

O SDK de Agentes agora está disponível em TypeScript, estendendo o suporte para desenvolvedores JavaScript e Node.js. Isso alinha o SDK com as pilhas de aplicativos web e nativas da nuvem modernas, permitindo a implantação de agentes em ambientes frontend e backend. O SDK TypeScript espelha os recursos da versão Python, incluindo suporte para handoffs, guardrails, rastreamento e o Protocolo de Contexto do Modelo (MCP).

O RealtimeAgents estende o SDK de Agentes com entrada/saída de áudio, interações com estado e tratamento de interrupções projetados especificamente para aplicativos de voz. A aprovação humana no loop (HITL) permite que os desenvolvedores interceptem a execução do agente para confirmação manual, o que é crucial para supervisão e conformidade. A OpenAI também atualizou seu modelo de fala para fala para reduzir a latência e melhorar a naturalidade das interações de áudio em tempo real. O modelo atualizado está disponível como gpt-4o-realtime-preview-2025-06-03 na API Realtime e gpt-4o-audio-preview-2025-06-03 na API Chat Completions.

Fontes

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

Encontrou um erro ou imprecisão?

Vamos considerar seus comentários assim que possível.