মাইক্রোসফট রিসার্চ ম্যাগমা উন্মোচন করেছে, যা একটি সমন্বিত এআই ফাউন্ডেশন মডেল যা সফটওয়্যার ইন্টারফেস এবং রোবোটিক সিস্টেম নিয়ন্ত্রণের জন্য ভিজ্যুয়াল এবং ভাষা প্রক্রিয়াকরণকে একত্রিত করে। পূর্ববর্তী এআই সিস্টেমগুলির থেকে ভিন্ন যেগুলির উপলব্ধি এবং নিয়ন্ত্রণের জন্য পৃথক মডেলের প্রয়োজন, ম্যাগমা এই ক্ষমতাগুলিকে একটি একক বেস মডেলে একত্রিত করে। মাইক্রোসফট ম্যাগমাকে এজেন্টিক এআই-এর দিকে একটি পদক্ষেপ হিসাবে স্থান দিয়েছে, যা এটিকে স্বায়ত্তশাসিতভাবে জটিল কাজগুলির পরিকল্পনা এবং সম্পাদনে সক্ষম করে। ম্যাগমা ট্রান্সফরমার-ভিত্তিক এলএলএম প্রযুক্তির উপর নির্মিত, ছবি, ভিডিও, রোবোটিক্স ডেটা এবং ইউআই ইন্টারঅ্যাকশনের সাথে প্রশিক্ষণের মাধ্যমে স্থানিক বুদ্ধিমত্তা অন্তর্ভুক্ত করে। এটি ম্যাগমাকে সত্যিকারের মাল্টিমোডাল এজেন্ট হিসাবে কাজ করতে দেয়, যা ব্যবহারকারী-সংজ্ঞায়িত লক্ষ্যের উপর ভিত্তি করে ইউজার ইন্টারফেস নেভিগেট করতে এবং শারীরিক বস্তুগুলিকে ম্যানিপুলেট করতে সক্ষম।
মাইক্রোসফটের ম্যাগমা: ডিজিটাল এবং ফিজিক্যাল ইন্টারঅ্যাকশনের জন্য একটি ইউনিফাইড এআই মডেল
সম্পাদনা করেছেন: Veronika Radoslavskaya
এই বিষয়ে আরও খবর পড়ুন:
আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?
আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।