মস্তিষ্কের চিত্রকে পাঠ্যে রূপান্তর: কৃত্রিম বুদ্ধিমত্তার যুগান্তকারী পদক্ষেপ
সম্পাদনা করেছেন: Vera Mo
গবেষকরা 'মাইন্ড ক্যাপশনিং' নামক এক যুগান্তকারী পদ্ধতির উন্মোচন করেছেন, যা মস্তিষ্কের কার্যকলাপকে সরাসরি বিশদ পাঠ্য বিবরণে রূপান্তরিত করে। এই অত্যাধুনিক উদ্ভাবনটি কার্যকরী চৌম্বকীয় অনুরণন ইমেজিং (fMRI) এবং কৃত্রিম বুদ্ধিমত্তা (AI) মডেলের সমন্বয়ে গঠিত। এটি মস্তিষ্কের উপস্থাপনাগুলিকে ডিকোড করে এবং সুসংগঠিত বাক্য তৈরি করতে সক্ষম। টোমোয়াসু হোড়িকাওয়া এবং তাঁর দল NTT কমিউনিকেশন সায়েন্স ল্যাবরেটরিজে এই কৌশলটি তৈরি করেছেন।
এই প্রক্রিয়ার প্রথম ধাপে, গবেষকরা অংশগ্রহণকারীদের ভিডিও দেখার সময় তাদের মস্তিষ্কের কার্যকলাপের ডেটা সংগ্রহ করেন, যেখানে বস্তু, ক্রিয়া এবং পরিবেশের মতো উপাদান ছিল। এরপর, একটি এআই মডেলকে প্রশিক্ষিত করা হয় যাতে এটি প্রতিটি পাঠ্য ক্যাপশনকে একটি অনন্য 'অর্থের স্বাক্ষর'-এ রূপান্তরিত করতে পারে। একটি পৃথক এআই সরঞ্জামকে এই অর্থ স্বাক্ষরের সাথে সম্পর্কিত মস্তিষ্কের কার্যকলাপের ধরণ শনাক্ত করার জন্য প্রশিক্ষণ দেওয়া হয়েছিল, যখন অংশগ্রহণকারীরা সেই ভিডিওগুলি দেখছিলেন। এই মস্তিষ্কের ডিকোডার এখন নতুন মস্তিষ্কের স্ক্যান বিশ্লেষণ করে সংশ্লিষ্ট শব্দার্থিক স্বাক্ষরটি অনুমান করতে পারে। অবশেষে, একটি এআই পাঠ্য জেনারেটর এই স্বাক্ষর ব্যবহার করে এমন একটি বাক্য তৈরি করে যা ডিকোড করা অর্থের সাথে নিবিড়ভাবে মেলে।
এই অ-আক্রমণাত্মক পদ্ধতিটি মস্তিষ্ক কীভাবে বিশ্বকে উপস্থাপন করে সে সম্পর্কে আরও নির্ভুল ধারণা দেয়, সরাসরি মস্তিষ্কের কার্যকলাপকে স্বাভাবিক ভাষায় অনুবাদ করে। গবেষণায় দেখা গেছে যে, যখন অংশগ্রহণকারীরা কেবল নীরব ভিডিও ক্লিপ দেখছিলেন বা স্মরণ করছিলেন, তখনও তাদের মস্তিষ্কের কার্যকলাপের মধ্যে দৃশ্যগুলির সঠিক বিবরণ তৈরি করার জন্য যথেষ্ট কাঠামোগত তথ্য বিদ্যমান ছিল। এমনকি মস্তিষ্কের ঐতিহ্যবাহী ভাষা অঞ্চলগুলির কার্যকলাপ বাদ দিয়েও, সিস্টেমটি বোধগম্য এবং কাঠামোগত বিবরণ তৈরি করতে সক্ষম হয়েছিল। এটি ইঙ্গিত দেয় যে অর্থপূর্ণ শব্দার্থিক তথ্য ভাষা প্রক্রিয়াকরণ কেন্দ্রগুলিতে সীমাবদ্ধ নয়, বরং ভিজ্যুয়াল এবং প্রাসঙ্গিক তথ্য প্রক্রিয়াকরণকারী অঞ্চলগুলিতেও বিস্তৃত।
এই অগ্রগতিটি স্নায়ুপ্রযুক্তির সাম্প্রতিক বিকাশের অংশ, যার লক্ষ্য যোগাযোগ উন্নত করা এবং জটিল মস্তিষ্কের প্রক্রিয়াগুলি বোঝা। গবেষকরা বিশ্বাস করেন যে 'মাইন্ড ক্যাপশনিং' একদিন অ্যাফেসিয়া বা পক্ষাঘাতের মতো পরিস্থিতিতে থাকা ব্যক্তিদের যোগাযোগের ক্ষেত্রে একটি নতুন কণ্ঠস্বর দিতে পারে, যারা চিন্তা করতে পারে কিন্তু কথা বলতে পারে না। তবে, এই ধরনের প্রযুক্তি মানসিক গোপনীয়তা এবং সম্মতির মতো গুরুত্বপূর্ণ নৈতিক প্রশ্ন উত্থাপন করে, যা এর ভবিষ্যতের ব্যবহারের জন্য গভীর প্রতিফলন দাবি করে। এই ধরনের 'মন পাঠের' প্রযুক্তির নৈতিক দিকগুলি নিয়ে আলোচনা দীর্ঘদিনের, যেখানে ব্যক্তিগত গোপনীয়তা এবং জ্ঞানীয় স্বাধীনতা গুরুত্বপূর্ণ উদ্বেগের কারণ। প্রযুক্তি যত বেশি কার্যকর হবে, তত দ্রুত নিশ্চিত করতে হবে যেন কর্পোরেশন বা সরকারগুলি এই ক্ষমতাকে অপব্যবহার করতে না পারে, বিশেষত যখন এটি মানুষের চিন্তা ও সিদ্ধান্তের মূল প্রক্রিয়াগুলিকে প্রভাবিত করার সম্ভাবনা রাখে।
উৎসসমূহ
Business AM
Page de Tomoyasu Horikawa - NTT Communication Science Laboratories
La technique de "mind captioning" peut lire les pensées humaines à partir des scans cérébraux
Un décodeur cérébral traduit les pensées visuelles en texte
এই বিষয়ে আরও খবর পড়ুন:
আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?
আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।
