OpenAI hat kürzlich seine KI-Agentenentwicklungstools aktualisiert, wobei der Schwerpunkt auf der Erweiterung der Plattformkompatibilität und der Verbesserung der Sprachschnittstellenfunktionen liegt. Diese Verbesserungen zielen darauf ab, die Erstellung von praktischeren, kontrollierbareren und überprüfbareren KI-Agenten für reale Anwendungen zu erleichtern.
Das Agents SDK ist jetzt in TypeScript verfügbar und erweitert die Unterstützung auf JavaScript- und Node.js-Entwickler. Dies richtet das SDK an modernen Web- und Cloud-nativen Anwendungsstacks aus und ermöglicht die Agentenbereitstellung in Frontend- und Backend-Umgebungen. Das TypeScript SDK spiegelt die Funktionen der Python-Version wider, einschließlich Unterstützung für Übergaben, Schutzschienen, Tracing und das Model Context Protocol (MCP).
RealtimeAgents erweitert das Agents SDK um Audioeingabe/-ausgabe, zustandsbehaftete Interaktionen und Unterbrechungsbehandlung, die speziell für Sprachanwendungen entwickelt wurden. Die Human-in-the-Loop (HITL)-Genehmigung ermöglicht es Entwicklern, die Agentenausführung zur manuellen Bestätigung abzufangen, was für die Aufsicht und Compliance von entscheidender Bedeutung ist. OpenAI hat außerdem sein Speech-to-Speech-Modell aktualisiert, um die Latenz zu reduzieren und die Natürlichkeit von Echtzeit-Audiointeraktionen zu verbessern. Das aktualisierte Modell ist als gpt-4o-realtime-preview-2025-06-03 in der Realtime API und gpt-4o-audio-preview-2025-06-03 in der Chat Completions API verfügbar.