脳内情景を言葉に変換する革新的「マインドキャプショニング」技術、NTT基礎研が確立

編集者: Vera Mo

人間の視覚や想像を詳細な文章記述へと写し取る、画期的な「マインドキャプショニング」と名付けられた手法が研究者によって確立された。この進歩は、機能的磁気共鳴画像法(fMRI)と最先端の人工知能モデルを組み合わせ、脳内の表象を解読し、自然な文章を生成するという新たな地平を切り開くものである。この技術は、NTTコミュニケーション科学基礎研究所の堀川智康氏とそのチームによって生み出されたことが明らかになった。

研究の核心は、AIモデルがデジタルな「意味の署名」を学習する点にある。まず、AIは2,000本以上のビデオクリップのテキストキャプションを分析し、それぞれの意味を固有のデジタル署名に変換した。次に、別のAIツールが、参加者がビデオを視聴する際の脳活動パターンと、その意味署名との対応関係を丹念に学習した。この過程を経て、脳の活動パターンを分析し対応する意味署名を予測する「脳内デコーダー」が完成し、最終的にAIテキスト生成モデルがデコードされた署名に基づき、意味に極めて近い文章を紡ぎ出す仕組みである。

この非侵襲的なアプローチは、脳が世界をどのように表現しているかについて精緻な洞察をもたらし、思考を直接的な言語へと翻訳する道筋を示す。実験では、滝を飛び降りるシーンを見た参加者の脳活動から、AIが「勢いよく流れる水の流れ」から「山腹の深い滝を飛び越える人物」へと記述を段階的に洗練させた事例が報告された。さらに、被験者が映像を思い出す際の脳活動からも正確な説明が生成されており、視覚情報の保存と思考が類似のメカニズムを利用していることが示唆された。

この技術は、発話が困難な方々の自己表現を力強く支援する大きな可能性を秘めている。失語症や脳卒中後遺症などで言語能力に制約を抱える人々が、途切れることなく意思を伝えられるようになるかもしれない。これは従来の単語レベルのマッピングを超え、意味や関係性を捉える点で、脳・コンピュータ・インターフェース(BCI)の新たな展開を示唆している。

一方で、人間の内面を読み取る技術の進展は、精神的なプライバシーの侵害や意図せぬ誤用といった倫理的な問いを伴う。研究チーム自身も、今後の利用には明確な同意の取得と厳格な倫理的枠組みの整備が不可欠であると指摘している。神経科学分野の指針に従い、この新技術の社会実装においても、倫理的・法的・社会的な側面(ELSI)への配慮が極めて重要となる。

ソース元

  • Business AM

  • Page de Tomoyasu Horikawa - NTT Communication Science Laboratories

  • La technique de "mind captioning" peut lire les pensées humaines à partir des scans cérébraux

  • Un décodeur cérébral traduit les pensées visuelles en texte

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。