OpenAI baru-baru ini memperbarui alat pengembangan agen AI-nya, dengan fokus pada perluasan kompatibilitas platform dan peningkatan kemampuan antarmuka suara. Peningkatan ini bertujuan untuk memfasilitasi pembuatan agen AI yang lebih praktis, terkendali, dan dapat diaudit untuk aplikasi dunia nyata.
Agen SDK sekarang tersedia di TypeScript, memperluas dukungan ke pengembang JavaScript dan Node.js. Ini menyelaraskan SDK dengan tumpukan aplikasi web dan cloud-native modern, memungkinkan penyebaran agen di seluruh lingkungan frontend dan backend. TypeScript SDK mencerminkan fitur versi Python, termasuk dukungan untuk handoff, guardrail, pelacakan, dan Protokol Konteks Model (MCP).
RealtimeAgents memperluas Agen SDK dengan input/output audio, interaksi stateful, dan penanganan interupsi yang dirancang khusus untuk aplikasi suara. Persetujuan human-in-the-loop (HITL) memungkinkan pengembang untuk mencegat eksekusi agen untuk konfirmasi manual, yang sangat penting untuk pengawasan dan kepatuhan. OpenAI juga telah memperbarui model speech-to-speech untuk mengurangi latensi dan meningkatkan kenaturalan interaksi audio real-time. Model yang diperbarui tersedia sebagai gpt-4o-realtime-preview-2025-06-03 di Realtime API dan gpt-4o-audio-preview-2025-06-03 di Chat Completions API.