OpenAI нещодавно оновила свої інструменти розробки AI-агентів, зосереджуючись на розширенні сумісності платформи та покращенні можливостей голосового інтерфейсу. Ці вдосконалення спрямовані на сприяння створенню більш практичних, контрольованих і аудіованих AI-агентів для реальних застосувань.
Agents SDK тепер доступний у TypeScript, розширюючи підтримку для розробників JavaScript і Node.js. Це узгоджує SDK із сучасними веб- і хмарно-рідними стеками додатків, дозволяючи розгортати агентів як у зовнішніх, так і у внутрішніх середовищах. TypeScript SDK відображає функції версії Python, включаючи підтримку передачі, захисних огороджень, трасування та протоколу контексту моделі (MCP).
RealtimeAgents розширює Agents SDK за допомогою аудіовходу/виходу, взаємодії зі збереженням стану та обробки переривань, спеціально розроблених для голосових додатків. Затвердження людиною в циклі (HITL) дозволяє розробникам перехоплювати виконання агента для ручного підтвердження, що має вирішальне значення для нагляду та відповідності. OpenAI також оновила свою модель перетворення мовлення на мовлення, щоб зменшити затримку та покращити природність аудіовзаємодії в реальному часі. Оновлена модель доступна як gpt-4o-realtime-preview-2025-06-03 в Realtime API і gpt-4o-audio-preview-2025-06-03 в Chat Completions API.