Kỹ thuật "Ghi Phụ Đề Tâm Trí" Nhật Bản Chuyển Hoạt Động Não Thành Văn Bản

Chỉnh sửa bởi: Elena HealthEnergy

Các nhà nghiên cứu Nhật Bản đã công bố một kỹ thuật mới mang tên "mind-captioning" (ghi phụ đề cho tâm trí), có khả năng giải mã hoạt động não bộ và chuyển nó thành các câu văn mô tả. Phát minh này, được trình bày trong ấn phẩm ngày 5 tháng 11 năm 2025 trên tạp chí *Science Advances*, đánh dấu một bước tiến trong việc kết nối hoạt động thần kinh với ngôn ngữ, mở ra triển vọng cho giao diện não-máy tính và các công cụ hỗ trợ giao tiếp.

Tiến sĩ Tomoyasu Horikawa thuộc Phòng thí nghiệm Khoa học Truyền thông NTT tại Nhật Bản là người đứng đầu công trình nghiên cứu này. Trong quá trình thực hiện, sáu người tham gia đã được chụp cộng hưởng từ chức năng (fMRI) trong khi xem tổng cộng 2.180 đoạn video không có âm thanh. Phương pháp của Horikawa đã chứng minh khả năng tạo ra các câu văn mạch lạc, phản ánh chính xác nội dung hình ảnh mà người tham gia quan sát, chỉ dựa trên dữ liệu fMRI thu thập được. Điều này đáng chú ý vì nó giải mã được các biểu diễn bán nghĩa (semantic features) của não bộ mà không cần phụ thuộc vào mạng lưới ngôn ngữ truyền thống của não bộ.

Quy trình kỹ thuật này bao gồm việc xây dựng các mô hình giải mã tuyến tính để dịch hoạt động não bộ do video tạo ra thành các đặc trưng ngữ nghĩa của chú thích tương ứng, sử dụng các mô hình ngôn ngữ sâu như DeBERTa và RoBERTa với khoảng 100 lần lặp tối ưu hóa. Sau đó, các mô hình này tối ưu hóa các mô tả ứng viên bằng cách căn chỉnh các đặc trưng của chúng với các đặc trưng giải mã từ não thông qua thay thế và nội suy từ ngữ. Khi người tham gia xem cảnh một người nhảy qua thác nước, hệ thống ban đầu có thể mô tả là "dòng nước chảy xiết", nhưng sau đó dần hoàn thiện thành câu văn chi tiết hơn như "một người nhảy qua thác nước sâu trên sườn núi". Hệ thống này tạo ra văn bản bằng tiếng Anh mặc dù những người tham gia là người bản xứ Nhật Bản, cho thấy khả năng tổng quát hóa ngôn ngữ đáng kể.

Giá trị cốt lõi của khám phá này nằm ở tiềm năng ứng dụng trong y tế và phục hồi chức năng thần kinh. Công nghệ này có thể cung cấp một con đường giao tiếp thay thế cho những cá nhân gặp khó khăn trong việc biểu đạt ngôn ngữ, chẳng hạn như những người mắc chứng mất ngôn ngữ (aphasia) hoặc bệnh xơ cứng teo cơ một bên (ALS), vì nó có thể hoạt động ngay cả khi có tổn thương ở mạng lưới ngôn ngữ. Các nhà nghiên cứu đã thu thập khoảng 17 giờ dữ liệu fMRI từ mỗi người tham gia để huấn luyện mô hình, một yêu cầu về dữ liệu cá nhân hóa đáng kể. Tiến sĩ Horikawa nhấn mạnh rằng phương pháp này diễn giải các đặc trưng ngữ nghĩa nội tại của não bộ để tạo ra mô tả bằng ngôn ngữ, chứ không giải mã những suy nghĩ riêng tư.

Bên cạnh những ứng dụng tích cực, các nhà đạo đức học như Marcello Ienca và Aukasz Szoszkiewicz đã đưa ra cảnh báo về những rủi ro tiềm ẩn liên quan đến quyền riêng tư của tâm trí, kêu gọi cần có sự đồng thuận nghiêm ngặt và các quy định chặt chẽ khi công nghệ này phát triển. Độ chính xác của mô hình khi xác định video đã xem hoặc tưởng tượng trong số 100 lựa chọn là khoảng 50%, và nó có thể mô tả lại những ký ức đã hồi tưởng với độ chính xác lên tới 40%. Sự phát triển này là một bước đệm quan trọng trong việc hiểu cách bộ não cấu trúc và lưu trữ các khái niệm thị giác phức tạp.

Nguồn

  • Ubergizmo

  • 'Mind reading'? Scientist turns mental images into text using AI technology

  • Scientists can now caption your thoughts. What could go wrong?

  • Scientist turns people’s mental images into text using ‘mind-captioning’ technology

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.