মস্তিষ্কের চিত্রকে পাঠ্যে রূপান্তর: কৃত্রিম বুদ্ধিমত্তার যুগান্তকারী পদক্ষেপ

সম্পাদনা করেছেন: Vera Mo

গবেষকরা 'মাইন্ড ক্যাপশনিং' নামক এক যুগান্তকারী পদ্ধতির উন্মোচন করেছেন, যা মস্তিষ্কের কার্যকলাপকে সরাসরি বিশদ পাঠ্য বিবরণে রূপান্তরিত করে। এই অত্যাধুনিক উদ্ভাবনটি কার্যকরী চৌম্বকীয় অনুরণন ইমেজিং (fMRI) এবং কৃত্রিম বুদ্ধিমত্তা (AI) মডেলের সমন্বয়ে গঠিত। এটি মস্তিষ্কের উপস্থাপনাগুলিকে ডিকোড করে এবং সুসংগঠিত বাক্য তৈরি করতে সক্ষম। টোমোয়াসু হোড়িকাওয়া এবং তাঁর দল NTT কমিউনিকেশন সায়েন্স ল্যাবরেটরিজে এই কৌশলটি তৈরি করেছেন।

এই প্রক্রিয়ার প্রথম ধাপে, গবেষকরা অংশগ্রহণকারীদের ভিডিও দেখার সময় তাদের মস্তিষ্কের কার্যকলাপের ডেটা সংগ্রহ করেন, যেখানে বস্তু, ক্রিয়া এবং পরিবেশের মতো উপাদান ছিল। এরপর, একটি এআই মডেলকে প্রশিক্ষিত করা হয় যাতে এটি প্রতিটি পাঠ্য ক্যাপশনকে একটি অনন্য 'অর্থের স্বাক্ষর'-এ রূপান্তরিত করতে পারে। একটি পৃথক এআই সরঞ্জামকে এই অর্থ স্বাক্ষরের সাথে সম্পর্কিত মস্তিষ্কের কার্যকলাপের ধরণ শনাক্ত করার জন্য প্রশিক্ষণ দেওয়া হয়েছিল, যখন অংশগ্রহণকারীরা সেই ভিডিওগুলি দেখছিলেন। এই মস্তিষ্কের ডিকোডার এখন নতুন মস্তিষ্কের স্ক্যান বিশ্লেষণ করে সংশ্লিষ্ট শব্দার্থিক স্বাক্ষরটি অনুমান করতে পারে। অবশেষে, একটি এআই পাঠ্য জেনারেটর এই স্বাক্ষর ব্যবহার করে এমন একটি বাক্য তৈরি করে যা ডিকোড করা অর্থের সাথে নিবিড়ভাবে মেলে।

এই অ-আক্রমণাত্মক পদ্ধতিটি মস্তিষ্ক কীভাবে বিশ্বকে উপস্থাপন করে সে সম্পর্কে আরও নির্ভুল ধারণা দেয়, সরাসরি মস্তিষ্কের কার্যকলাপকে স্বাভাবিক ভাষায় অনুবাদ করে। গবেষণায় দেখা গেছে যে, যখন অংশগ্রহণকারীরা কেবল নীরব ভিডিও ক্লিপ দেখছিলেন বা স্মরণ করছিলেন, তখনও তাদের মস্তিষ্কের কার্যকলাপের মধ্যে দৃশ্যগুলির সঠিক বিবরণ তৈরি করার জন্য যথেষ্ট কাঠামোগত তথ্য বিদ্যমান ছিল। এমনকি মস্তিষ্কের ঐতিহ্যবাহী ভাষা অঞ্চলগুলির কার্যকলাপ বাদ দিয়েও, সিস্টেমটি বোধগম্য এবং কাঠামোগত বিবরণ তৈরি করতে সক্ষম হয়েছিল। এটি ইঙ্গিত দেয় যে অর্থপূর্ণ শব্দার্থিক তথ্য ভাষা প্রক্রিয়াকরণ কেন্দ্রগুলিতে সীমাবদ্ধ নয়, বরং ভিজ্যুয়াল এবং প্রাসঙ্গিক তথ্য প্রক্রিয়াকরণকারী অঞ্চলগুলিতেও বিস্তৃত।

এই অগ্রগতিটি স্নায়ুপ্রযুক্তির সাম্প্রতিক বিকাশের অংশ, যার লক্ষ্য যোগাযোগ উন্নত করা এবং জটিল মস্তিষ্কের প্রক্রিয়াগুলি বোঝা। গবেষকরা বিশ্বাস করেন যে 'মাইন্ড ক্যাপশনিং' একদিন অ্যাফেসিয়া বা পক্ষাঘাতের মতো পরিস্থিতিতে থাকা ব্যক্তিদের যোগাযোগের ক্ষেত্রে একটি নতুন কণ্ঠস্বর দিতে পারে, যারা চিন্তা করতে পারে কিন্তু কথা বলতে পারে না। তবে, এই ধরনের প্রযুক্তি মানসিক গোপনীয়তা এবং সম্মতির মতো গুরুত্বপূর্ণ নৈতিক প্রশ্ন উত্থাপন করে, যা এর ভবিষ্যতের ব্যবহারের জন্য গভীর প্রতিফলন দাবি করে। এই ধরনের 'মন পাঠের' প্রযুক্তির নৈতিক দিকগুলি নিয়ে আলোচনা দীর্ঘদিনের, যেখানে ব্যক্তিগত গোপনীয়তা এবং জ্ঞানীয় স্বাধীনতা গুরুত্বপূর্ণ উদ্বেগের কারণ। প্রযুক্তি যত বেশি কার্যকর হবে, তত দ্রুত নিশ্চিত করতে হবে যেন কর্পোরেশন বা সরকারগুলি এই ক্ষমতাকে অপব্যবহার করতে না পারে, বিশেষত যখন এটি মানুষের চিন্তা ও সিদ্ধান্তের মূল প্রক্রিয়াগুলিকে প্রভাবিত করার সম্ভাবনা রাখে।

উৎসসমূহ

  • Business AM

  • Page de Tomoyasu Horikawa - NTT Communication Science Laboratories

  • La technique de "mind captioning" peut lire les pensées humaines à partir des scans cérébraux

  • Un décodeur cérébral traduit les pensées visuelles en texte

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।