OpenAI জুন 2025-এ TypeScript SDK, রিয়েল-টাইম ভয়েস বৈশিষ্ট্য এবং উন্নত স্পিচ মডেলের সাথে AI এজেন্ট ডেভেলপমেন্ট উন্নত করেছে

সম্পাদনা করেছেন: gaya ❤️ one

OpenAI সম্প্রতি তার AI এজেন্ট ডেভেলপমেন্ট টুল আপডেট করেছে, প্ল্যাটফর্মের সামঞ্জস্যতা প্রসারিত করার দিকে এবং ভয়েস ইন্টারফেসের ক্ষমতা উন্নত করার দিকে মনোযোগ দিয়েছে। এই উন্নতিগুলির লক্ষ্য হল বাস্তব-বিশ্বের অ্যাপ্লিকেশনগুলির জন্য আরও ব্যবহারিক, নিয়ন্ত্রণযোগ্য এবং নিরীক্ষণযোগ্য AI এজেন্ট তৈরি করা।

এজেন্টস SDK এখন TypeScript-এ উপলব্ধ, যা জাভাস্ক্রিপ্ট এবং Node.js ডেভেলপারদের জন্য সমর্থন প্রসারিত করে। এটি SDK-কে আধুনিক ওয়েব এবং ক্লাউড-নেটিভ অ্যাপ্লিকেশন স্ট্যাকের সাথে সারিবদ্ধ করে, যা ফ্রন্টএন্ড এবং ব্যাকএন্ড উভয় পরিবেশে এজেন্ট স্থাপন করতে সক্ষম করে। TypeScript SDK পাইথন সংস্করণের বৈশিষ্ট্যগুলিকে প্রতিফলিত করে, যার মধ্যে হ্যান্ডঅফ, গার্ডরেল, ট্রেসিং এবং মডেল কনটেক্সট প্রোটোকল (MCP) এর জন্য সমর্থন অন্তর্ভুক্ত রয়েছে।

RealtimeAgents অডিও ইনপুট/আউটপুট, স্টেটফুল ইন্টারঅ্যাকশন এবং বিশেষভাবে ভয়েস অ্যাপ্লিকেশনগুলির জন্য ডিজাইন করা ইন্টারাপশন হ্যান্ডলিং সহ এজেন্টস SDK প্রসারিত করে। হিউম্যান-ইন-দ্য-লুপ (HITL) অনুমোদন ডেভেলপারদের ম্যানুয়াল নিশ্চিতকরণের জন্য এজেন্ট এক্সিকিউশন আটকাতে দেয়, যা তত্ত্বাবধান এবং সম্মতির জন্য অত্যন্ত গুরুত্বপূর্ণ। OpenAI রিয়েল-টাইম অডিও ইন্টারঅ্যাকশনের লেটেন্সি কমাতে এবং স্বাভাবিকতা উন্নত করতে তার স্পিচ-টু-স্পিচ মডেলও আপডেট করেছে। আপডেট করা মডেলটি রিয়েলটাইম API-তে gpt-4o-realtime-preview-2025-06-03 হিসাবে এবং চ্যাট কমপ্লিশন API-তে gpt-4o-audio-preview-2025-06-03 হিসাবে উপলব্ধ।

উৎসসমূহ

  • MarkTechPost

  • OpenAI Developer Community

  • MarkTechPost

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।