OpenAI ने जून 2025 में TypeScript SDK, रियल-टाइम वॉइस फीचर्स और बेहतर स्पीच मॉडल के साथ AI एजेंट डेवलपमेंट को बढ़ाया

द्वारा संपादित: gaya ❤️ one

OpenAI ने हाल ही में अपने AI एजेंट डेवलपमेंट टूल्स को अपडेट किया है, जिसका फोकस प्लेटफ़ॉर्म कम्पैटिबिलिटी का विस्तार करना और वॉइस इंटरफ़ेस क्षमताओं में सुधार करना है। इन संवर्द्धनों का उद्देश्य वास्तविक दुनिया के अनुप्रयोगों के लिए अधिक व्यावहारिक, नियंत्रणीय और ऑडिट करने योग्य AI एजेंटों का निर्माण करना है।

एजेंट्स SDK अब TypeScript में उपलब्ध है, जो जावास्क्रिप्ट और Node.js डेवलपर्स के लिए समर्थन का विस्तार करता है। यह SDK को आधुनिक वेब और क्लाउड-नेटिव एप्लिकेशन स्टैक के साथ संरेखित करता है, जिससे फ्रंटएंड और बैकएंड दोनों वातावरणों में एजेंट की तैनाती सक्षम होती है। TypeScript SDK, Python संस्करण की सुविधाओं को प्रतिबिंबित करता है, जिसमें हैंडऑफ़, गार्डरेल, ट्रेसिंग और मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) के लिए समर्थन शामिल है।

RealtimeAgents ऑडियो इनपुट/आउटपुट, स्टेटफुल इंटरैक्शन और विशेष रूप से वॉइस एप्लिकेशन के लिए डिज़ाइन किए गए इंटरप्शन हैंडलिंग के साथ एजेंट्स SDK का विस्तार करता है। ह्यूमन-इन-द-लूप (HITL) अनुमोदन डेवलपर्स को मैनुअल पुष्टि के लिए एजेंट निष्पादन को रोकने की अनुमति देता है, जो निरीक्षण और अनुपालन के लिए महत्वपूर्ण है। OpenAI ने रीयल-टाइम ऑडियो इंटरैक्शन की लेटेंसी को कम करने और स्वाभाविकता में सुधार करने के लिए अपने स्पीच-टू-स्पीच मॉडल को भी अपडेट किया है। अपडेटेड मॉडल Realtime API में gpt-4o-realtime-preview-2025-06-03 के रूप में और Chat Completions API में gpt-4o-audio-preview-2025-06-03 के रूप में उपलब्ध है।

स्रोतों

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

क्या आपने कोई गलती या अशुद्धि पाई?

हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।