Nhà Nghiên Cứu Bikram Biruli Từ Odisha Ứng Dụng Trí Tuệ Nhân Tạo Để Bảo Tồn Ngôn Ngữ Ho

Chỉnh sửa bởi: Vera Mo

Nhà nghiên cứu trẻ Bikram Biruli, 29 tuổi, người gốc làng Adivasi Ho Matkam Sahi thuộc quận Mayurbhanj, bang Odisha, đã nhận được sự công nhận rộng rãi nhờ công trình tiên phong trong việc bảo tồn ngôn ngữ Ho thông qua công nghệ trí tuệ nhân tạo (AI). Nỗ lực của anh nhằm gìn giữ di sản văn hóa đã chứng minh một cách rõ ràng rằng các công cụ hiện đại có thể trở thành trợ thủ đắc lực cho việc duy trì các truyền thống cổ xưa. Vào tháng 9 năm 2025, Biruli đã hoàn thành chương trình tiến sĩ tại Viện Khoa học Xã hội Kalinga (KiSS) ở Odisha, qua đó trở thành nhà nghiên cứu đầu tiên thuộc dân tộc Ho áp dụng AI vào lĩnh vực bảo tồn ngôn ngữ.

Hành trình của Biruli bắt nguồn từ những trải nghiệm cá nhân sâu sắc: anh kể lại việc mình vừa chăn gia súc vừa ghi chép bằng phấn trên bảng đá để học tiếng mẹ đẻ. Sự gắn bó mật thiết với văn hóa này đã đặt nền móng cho dự án đầy tham vọng của anh, với mục tiêu cao nhất là giúp ngôn ngữ của dân tộc mình được máy móc nhận diện ngang hàng với tiếng Anh hoặc tiếng Hindi. Ngôn ngữ Ho thuộc ngữ hệ Nam Á (Austroasiatic). Theo thống kê dân số năm 2011, có khoảng 1,4 triệu người sử dụng ngôn ngữ này, chủ yếu tập trung tại Jharkhand và Odisha. Mặc dù Ho đã được công nhận là “ngôn ngữ chính thức thứ hai” tại Jharkhand vào năm 2011, nó vẫn chưa được đưa vào Phụ lục thứ Tám của Hiến pháp Ấn Độ, điều này khiến ngôn ngữ này thiếu đi sự bảo vệ cấp cao nhất từ chính phủ. Đối với nhiều thành viên cộng đồng, ngôn ngữ Ho đồng nghĩa với sự sinh tồn và ký ức dân tộc.

Trong khuôn khổ nghiên cứu tiến sĩ của mình, Biruli đã phát triển một mô hình AI tinh vi, tập trung vào ba khía cạnh cốt lõi. Anh đã sử dụng công nghệ Nhận dạng Giọng nói Tự động (ASR) để chuyển đổi lời nói Ho sang văn bản, Nhận dạng Thực thể Có tên (Entity Recognition) để phân loại các loại từ, và Gắn thẻ Từ loại (POS Tagging) để phân tích cấu trúc ngữ pháp. Để huấn luyện mô hình này, khoảng 20.000 câu tiếng Ho đã được chuyển đổi, sử dụng hệ thống chữ viết độc đáo Warang Kshiti. Warang Kshiti là một hệ thống chữ viết bản địa do Lako Bodra sáng tạo, được người bản xứ ưa chuộng hơn các biến thể dựa trên chữ Devanagari hoặc chữ Latinh.

Công trình của Biruli là một lời đáp mạnh mẽ nhằm nâng cao vị thế của ngôn ngữ Ho trong không gian kỹ thuật số, đối chọi lại những định kiến hiện có. Nhà khoa học này có kế hoạch sắp tới là đệ trình lên Bộ Các vấn đề Bộ lạc Ấn Độ, đề xuất tích hợp mô hình AI của mình vào các nền tảng kỹ thuật số của nhà nước. Anh mong muốn đưa tiếng Ho vào các ứng dụng như Adi Vaani — vốn đã hỗ trợ các ngôn ngữ như Gondi, Bhili, Mundari và Santali — cũng như tích hợp vào Google Translate. Việc triển khai thành công dự án này có thể tạo ra một tiền lệ quan trọng cho sự hiện diện và phẩm giá kỹ thuật số của các ngôn ngữ bộ lạc trên khắp đất nước, mở ra những chân trời mới cho việc truyền đạt chúng đến các thế hệ tương lai.

Nguồn

  • The Indian Express

  • From grazing cattle to training AI: How a Ho scholar is digitally reviving his mother tongue

  • He Once Grazed Cattle — Now He’s Using AI to Save His Mother Tongue

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.