NTT、脳活動から記述テキストを生成する「マインド・キャプショニング」技術を発表

編集者: Elena HealthEnergy

NTTコミュニケーション科学基礎研究所の堀川智康氏らが主導した研究により、人間の脳活動を直接、記述的な文章へと変換する手法「マインド・キャプショニング」が公表された。この成果は、2025年11月5日に学術誌『Science Advances』に詳細が掲載され、視覚情報の処理メカニズムの解明と、コミュニケーション補助技術への応用という二つの可能性を提示している。

本研究の核心は、従来の思考翻訳技術が内言や発話関連領域の活動に依存していたのに対し、非言語的な心的表象を言語化する点にある。堀川氏らの手法では、まず参加者がfMRI(機能的磁気共鳴画像法)スキャナー内で2,180本の無音ビデオクリップを視聴する過程で生じた脳活動を記録した。この脳活動データと、対応するビデオキャプションから抽出されたセマンティック特徴量を、深層言語モデル(DeBERTaやRoBERTaなど)を用いて結びつけ、線形デコーディングモデルを構築した。このプロセスにより、AIは被験者が視覚的に捉えた内容や、記憶から想起した情景を、一貫性のある文章として再現することに成功した。

実験結果は、この技術が単なる単語の羅列を超えた、構造化された意味の理解を示唆している。被験者が視聴した映像について、AIは100通りの候補の中から正しい内容を約50%の精度で特定した。さらに特筆すべきは、被験者が映像を「思い出した」際の脳活動からも、元の内容を記述する能力を示した点であり、記憶の言語化においても最大で40%の識別精度を達成した。この手法は、言語ネットワークの活動に依存しないため、失語症や筋萎縮性側索硬化症(ALS)などで言語表現に困難を抱える人々にとって、新たな意思伝達の経路を開く潜在能力を持つ。

研究を主導した堀川氏は、この技術が「ディストピア的な意味でのマインドリーディングではない」と明確に述べている。このシステムは、個人の秘匿された思考を直接復元するのではなく、脳が意味を内部的に表現する方法、すなわちセマンティック特徴量を解釈し、言語的記述へと変換するインターフェースとして機能する。しかしながら、この技術の進展は、個人の思考という最も私的な領域へのアクセスを可能にするため、倫理学者からは精神的プライバシー侵害のリスクに対する厳格な同意取得と規制の必要性が指摘されている。

この「マインド・キャプショニング」は、脳科学における長年の課題であった、複数の要素とその相互作用を含む心的内容の解読に一歩前進をもたらした。従来の技術が単語レベルの識別にとどまっていたのに対し、本手法は主語、動詞、目的語を含む完全な文章を生成する能力を有しており、これはAIが人間の脳の構造的意味理解と類似した処理を行っている可能性を示唆する。研究には6名の参加者が関与し、各参加者は約17時間にわたるfMRIデータを提供したと報告されている。

ソース元

  • Ubergizmo

  • 'Mind reading'? Scientist turns mental images into text using AI technology

  • Scientists can now caption your thoughts. What could go wrong?

  • Scientist turns people’s mental images into text using ‘mind-captioning’ technology

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。