जापान के शोधकर्ताओं ने 'माइंड-कैप्शनिंग' नामक एक तकनीक का प्रदर्शन किया है, जो मानव मस्तिष्क की गतिविधि को सीधे वर्णनात्मक पाठ में रूपांतरित करती है। यह वैज्ञानिक उपलब्धि जटिल मानसिक कल्पनाओं की व्याख्या करने की दिशा में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करती है। इस शोध का विवरण 5 नवंबर, 2025 को प्रतिष्ठित पत्रिका साइंस एडवांसेज में प्रकाशित हुआ था, और यह संचार सहायता तथा मस्तिष्क में दृश्य सूचना प्रसंस्करण की गहरी समझ के लिए संभावित लाभ प्रदान करता है।
इस शोध का नेतृत्व एनटीटी कम्युनिकेशन साइंस लेबोरेटरीज, जापान के टोमोयासु होरिकावा ने किया, जिन्होंने छह प्रतिभागियों पर प्रयोग किया। इन प्रतिभागियों ने कार्यात्मक चुंबकीय अनुनाद इमेजिंग (fMRI) से गुजरते हुए कुल 2,180 मूक वीडियो क्लिप देखे। होरिकावा की पद्धति की सफलता इस तथ्य में निहित है कि यह केवल fMRI डेटा के आधार पर "सुसंगत वाक्य उत्पन्न करने में सक्षम थी जो प्रतिभागियों द्वारा देखे गए दृश्य सामग्री को दर्शाते थे।" यह विकास तंत्रिका गतिविधि को भाषा से जोड़ने की दिशा में एक महत्वपूर्ण प्रगति है, जो मस्तिष्क-कंप्यूटर इंटरफेस (BCI) के भविष्य के विकास को गति दे सकता है।
माइंड-कैप्शनिंग की कार्यप्रणाली में दो मुख्य चरण शामिल हैं: पहले, मस्तिष्क गतिविधि को एक गहरे भाषा मॉडल का उपयोग करके अर्थ संबंधी विशेषताओं में अनुवादित करना, और दूसरा, उन विशेषताओं के साथ संरेखित होने वाले प्राकृतिक भाषा विवरण उत्पन्न करना। शोधकर्ताओं ने पाया कि यह प्रणाली मस्तिष्क के पारंपरिक भाषा क्षेत्रों की गतिविधि पर निर्भर हुए बिना भी वर्णनात्मक पाठ उत्पन्न कर सकती है, जो यह संकेत देता है कि अर्थ संबंधी जानकारी मस्तिष्क के विभिन्न क्षेत्रों में वितरित होती है। प्रतिभागियों ने जो वीडियो क्लिप देखे, वे मूक थे और उनमें वस्तुएं, क्रियाएं तथा सामाजिक संपर्क शामिल थे, जिससे यह सुनिश्चित हुआ कि उत्पन्न पाठ सीधे तौर पर देखे गए दृश्य पर आधारित था।
इस तकनीक को विकसित करने के लिए, होरिकावा की टीम ने बड़े भाषा मॉडल (LLMs) का उपयोग किया, जिन्होंने वीडियो के कैप्शन को संख्यात्मक अनुक्रमों में परिवर्तित किया। इसके बाद, सरल एआई मॉडल ('डिकोडर') को इन अनुक्रमों से संबंधित मस्तिष्क गतिविधि के पैटर्न से मिलान करने के लिए प्रशिक्षित किया गया। यह प्रणाली केवल देखे गए दृश्यों का ही नहीं, बल्कि प्रतिभागियों द्वारा याद किए गए दृश्यों की मस्तिष्क गतिविधि से भी विवरण उत्पन्न करने में सक्षम थी, हालांकि याद करने की स्थिति में प्रदर्शन सीधे देखने की तुलना में कम था। इसके अतिरिक्त, यह प्रणाली अंग्रेजी में पाठ उत्पन्न करने में सक्षम थी, भले ही प्रतिभागी मूल रूप से जापानी भाषी थे।
इस खोज का मूल्य उन व्यक्तियों के लिए संचार क्षमताओं को बहाल करने की इसकी क्षमता में है जिन्हें बोलने में कठिनाई होती है, जैसे कि वाचाघात (aphasia) से पीड़ित लोग। हालांकि, शोधकर्ताओं ने नैतिक चुनौतियों, विशेष रूप से मानसिक गोपनीयता के जोखिमों के बारे में चेतावनी दी है, और सख्त सहमति तथा विनियमन की आवश्यकता पर बल दिया है। यह तकनीक अभी भी प्रारंभिक अवस्था में है, जिसके लिए बड़ी मात्रा में व्यक्तिगत प्रशिक्षण डेटा और महंगे, धीमे एमआरआई मशीनों की आवश्यकता होती है, और यह भावनात्मक स्वर या व्यक्तिगत व्याख्या को पकड़ने में संघर्ष करती है।



