Cientistas Japoneses Traduzem Atividade Cerebral em Texto Descritivo com Técnica de "Mind-Captioning"

Editado por: Elena HealthEnergy

Pesquisadores no Japão anunciaram um avanço significativo em neurociência computacional com o desenvolvimento de uma técnica denominada "mind-captioning" (legendagem mental), capaz de converter diretamente a atividade cerebral em narrativas textuais descritivas. Esta metodologia oferece uma nova perspectiva para a interpretação de imagens mentais complexas, buscando superar as limitações na decodificação de representações não verbais. O estudo fundamental foi publicado na revista Science Advances em 5 de novembro de 2025.

O trabalho foi conduzido por Tomoyasu Horikawa, dos Laboratórios de Ciência da Comunicação da NTT no Japão, utilizando ressonância magnética funcional (fMRI) para monitorar seis voluntários adultos, falantes nativos de japonês, com idades entre 22 e 37 anos. Os participantes foram submetidos a sessões de fMRI enquanto visualizavam 2.180 clipes de vídeo mudos. O objetivo central da pesquisa era estabelecer uma correlação entre as representações mentais não verbais e a linguagem estruturada, contornando as restrições de métodos anteriores que dependiam de atividade verbal.

O sistema desenvolvido demonstrou a capacidade de gerar sentenças coerentes que espelhavam o conteúdo visual observado ou recordado pelos participantes, utilizando exclusivamente os dados de fMRI. A engenharia do sistema envolveu a conversão das legendas dos vídeos em sequências numéricas por meio de modelos de linguagem grandes (LLMs), criando um espaço semântico rico para o alinhamento. Decodificadores de inteligência artificial foram então treinados para correlacionar os padrões de ativação cerebral com essas assinaturas de significado numérico.

Um achado notável foi a capacidade do sistema de produzir descrições fluidas mesmo quando as regiões cerebrais tradicionalmente ligadas à linguagem, como as áreas de Broca e Wernicke, foram excluídas da análise, indicando uma distribuição ampla da semântica visual. A eficácia da técnica estendeu-se à decodificação de memórias visuais; durante testes de recordação de 72 vídeos, o sistema produziu descrições textuais precisas das lembranças. O processo iterativo refinava uma frase inicial até que sua assinatura semântica se alinhasse com a atividade cerebral decodificada, tecendo ações, objetos e contexto.

Embora o modelo de linguagem tenha gerado o texto final em inglês, a precisão na identificação correta de vídeos entre 100 candidatos atingiu aproximadamente 50%. Horikawa, que também tem experiência na decodificação de imagens durante o sono, classificou este desenvolvimento como um passo decisivo na integração da atividade neural com a linguagem, abrindo caminho para interfaces cérebro-computador mais avançadas. As implicações para a saúde são amplas, especialmente no potencial de restaurar a comunicação em indivíduos com condições neurológicas severas, como afasia ou síndrome do encarceramento.

A implementação desta tecnologia, contudo, suscita questões éticas relativas à privacidade mental, dada a coleta de aproximadamente 17 horas de dados por participante. Especialistas, como Łukasz Szoszkiewicz da Fundação Neurorights, alertam que, apesar do imenso potencial assistivo, as salvaguardas para a liberdade de pensamento devem ser rigorosamente estabelecidas. A pesquisa, que utilizou otimizações baseadas em modelos como DeBERTa e RoBERTa, estabelece uma nova fronteira na compreensão da codificação de informação visual pelo cérebro e na comunicação não verbal homem-máquina.

Fontes

  • Ubergizmo

  • 'Mind reading'? Scientist turns mental images into text using AI technology

  • Scientists can now caption your thoughts. What could go wrong?

  • Scientist turns people’s mental images into text using ‘mind-captioning’ technology

Encontrou um erro ou imprecisão?

Vamos considerar seus comentários assim que possível.