来自奥里萨邦马尤尔布汉杰县阿迪瓦西霍族马特卡姆萨希村的年轻学者比克拉姆·比鲁利,因其利用人工智能技术保护濒危霍语的开创性工作而广受赞誉。这位29岁的研究人员对文化遗产保护的坚定承诺,生动地展示了现代科技工具如何能够为古老传统的延续提供强大的支持。比鲁利于2025年9月在奥里萨邦的卡林加社会科学学院(KiSS)完成了他的博士学位。他不仅是该机构的毕业生,更是首位将人工智能应用于语言保护领域的霍族研究人员,这一成就具有里程碑意义。
比鲁利的研究之路源于他个人的成长经历。他回忆起童年时放牧牲畜,并用粉笔在石板上书写来学习母语的场景。这种深厚的文化浸润为他雄心勃勃的项目奠定了基础:他致力于实现霍语的机器识别能力,使其能够与英语或印地语等主流语言享有同等的数字地位。霍语隶属于南亚语系。根据2011年的人口普查数据,该语言拥有约140万使用者,主要分布在贾坎德邦和奥里萨邦。尽管霍语在2011年获得了贾坎德邦“第二官方语言”的地位,但它尚未被纳入《印度宪法第八附表》,这意味着它缺乏最高级别的国家保护。对于许多社区成员而言,语言不仅仅是交流工具,更是民族生存与记忆的代名词。
在他的博士研究期间,比鲁利精心设计了一个复杂的AI模型,该模型的核心聚焦于三个关键技术层面。他采用了自动语音识别(ASR)技术,将霍语的口语转录为文本;利用命名实体识别(Entity Recognition)来对词汇类型进行精确分类;并实施了词性标注(POS Tagging)来深入分析其语法结构。为了训练这一模型,他转换了大约20,000个霍语句子。这些数据均采用独特的瓦朗·克希蒂文字记录。瓦朗·克希蒂文字是拉科·博德拉创造的一种原创书写系统,霍语使用者更倾向于使用它,而非基于天城文或拉丁文的变体。
比鲁利的工作有力地回应了现存的偏见,旨在显著提升霍语在数字空间中的重要性。这位学者计划向印度部落事务部提出申请,建议将他开发的AI模型整合到国家的数字平台中。他期望霍语能够被纳入像“阿迪瓦尼”(Adi Vaani)这样的应用程序中——该程序目前已支持贡迪语、比尔语、蒙达里语和桑塔利语等语言——并最终进入谷歌翻译系统。如果该项目能够成功落地,将为印度部落语言的数字可见性和尊严树立一个重要的先例,为这些语言向后代传承开启全新的视野。