OpenAI ने हाल ही में अपने AI एजेंट डेवलपमेंट टूल्स को अपडेट किया है, जिसका फोकस प्लेटफ़ॉर्म कम्पैटिबिलिटी का विस्तार करना और वॉइस इंटरफ़ेस क्षमताओं में सुधार करना है। इन संवर्द्धनों का उद्देश्य वास्तविक दुनिया के अनुप्रयोगों के लिए अधिक व्यावहारिक, नियंत्रणीय और ऑडिट करने योग्य AI एजेंटों का निर्माण करना है।
एजेंट्स SDK अब TypeScript में उपलब्ध है, जो जावास्क्रिप्ट और Node.js डेवलपर्स के लिए समर्थन का विस्तार करता है। यह SDK को आधुनिक वेब और क्लाउड-नेटिव एप्लिकेशन स्टैक के साथ संरेखित करता है, जिससे फ्रंटएंड और बैकएंड दोनों वातावरणों में एजेंट की तैनाती सक्षम होती है। TypeScript SDK, Python संस्करण की सुविधाओं को प्रतिबिंबित करता है, जिसमें हैंडऑफ़, गार्डरेल, ट्रेसिंग और मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) के लिए समर्थन शामिल है।
RealtimeAgents ऑडियो इनपुट/आउटपुट, स्टेटफुल इंटरैक्शन और विशेष रूप से वॉइस एप्लिकेशन के लिए डिज़ाइन किए गए इंटरप्शन हैंडलिंग के साथ एजेंट्स SDK का विस्तार करता है। ह्यूमन-इन-द-लूप (HITL) अनुमोदन डेवलपर्स को मैनुअल पुष्टि के लिए एजेंट निष्पादन को रोकने की अनुमति देता है, जो निरीक्षण और अनुपालन के लिए महत्वपूर्ण है। OpenAI ने रीयल-टाइम ऑडियो इंटरैक्शन की लेटेंसी को कम करने और स्वाभाविकता में सुधार करने के लिए अपने स्पीच-टू-स्पीच मॉडल को भी अपडेट किया है। अपडेटेड मॉडल Realtime API में gpt-4o-realtime-preview-2025-06-03 के रूप में और Chat Completions API में gpt-4o-audio-preview-2025-06-03 के रूप में उपलब्ध है।