“心语捕获”技术革新:脑电波解码实现细腻文字叙述

编辑者: Vera Mo

一项名为“心语捕获”(Mind Captioning)的开创性方法问世,它以前所未有的精度,能够将人脑的活动信号转化为对所见或所想内容的详尽文字描述。这项技术突破标志着神经科学与人工智能领域的深度融合,为深入洞察人类的内在表征开辟了新的途径。

该前沿技术的构建工作由日本NTT通信科学研究所的Tomoyasu Horikawa及其团队主导完成。研究人员巧妙地结合了功能性磁共振成像(fMRI)技术与尖端人工智能模型,致力于破解大脑的“语义密码”。研究的基础在于对海量数据的深度学习:团队首先收集了超过2000段视频的文本说明,并利用大型语言模型(LM)将每段说明转化为一种独特的“意义特征签名”,即一种代表核心概念的数字化向量表示。随后,一个独立的AI工具被训练来识别参与者观看视频时,与这些“意义特征签名”相对应的特定脑部活动模式。

这一非侵入性的脑部解码器现已具备分析新的脑部扫描并预测相应语义特征的能力。最终,一个AI文本生成器利用解码出的特征签名,构造出与被试者内心所感高度契合的自然语言句子。研究结果表明,即使在参与者仅是回忆或想象时,其脑部活动中也蕴含着足够结构化的信息以生成准确的描述,这证明了该系统对主观回忆的泛化能力。

“心语捕获”的精妙之处在于,它超越了以往仅能识别简单词汇或分类的局限,能够推断并生成全新的、描述复杂情境的文本,这些文本可能从未在训练数据中出现过。研究人员通过迭代优化方法,利用一个经过掩码语言模型(MLM)训练的语言模型来约束文本生成过程,确保输出句子更贴合大脑解码出的特征,同时保持了对结构化视觉语义的可解释性。

这项技术革新不仅为理解大脑如何将感知和记忆转化为语言表达提供了宝贵线索,更蕴含着深远的社会价值。它被视为一种潜在的“替代沟通路径”,有望为因失语症等神经系统疾病而面临沟通障碍的个体,架起一座将思维直接转化为文字的桥梁。然而,任何触及人类内心世界的科技进步都伴随着对未来格局的深思,这项突破也引出了关于精神隐私和知情同意的严肃伦理议题,要求对技术的未来应用进行审慎规划与引导。

来源

  • Business AM

  • Page de Tomoyasu Horikawa - NTT Communication Science Laboratories

  • La technique de "mind captioning" peut lire les pensées humaines à partir des scans cérébraux

  • Un décodeur cérébral traduit les pensées visuelles en texte

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。