年僅29歲的研究員比克拉姆·比魯利(Bikram Biruli),來自奧里薩邦馬尤爾布漢傑縣的阿迪瓦西霍馬特卡姆薩希村,因其利用人工智慧技術開創性地保護霍語(Ho language)的工作而獲得廣泛認可。他對維護文化遺產的堅定承諾,展現了現代科技工具如何成為支持古老傳統的強大支柱。比魯利於2025年9月在奧里薩邦的卡林加社會科學學院(Kalinga Institute of Social Sciences, KiSS)完成了他的博士學位研究。他不僅是霍族(Ho people)中首位博士研究員,更是第一位將人工智慧應用於語言保存領域的霍族學者。
比魯利的研究之路源於他的個人經歷:他回憶起小時候一邊放牧,一邊用粉筆在石板上書寫,學習母語的情景。這種對自身文化的深刻投入,成為他宏大專案的基石,該專案的目標是讓霍族語言的機器識別能力,能夠與英語或印地語等主流語言並駕齊驅。霍語隸屬於南亞語系(Austroasiatic family)。根據2011年的人口普查數據,約有140萬人使用霍語,主要分佈在賈坎德邦和奧里薩邦。儘管霍語在2011年獲得了賈坎德邦「第二官方語言」的地位,但它至今仍未被納入《印度憲法第八附表》,這意味著它無法得到最高層級的國家保護。對於許多社群成員來說,語言不僅是溝通工具,更是民族生存與記憶的代名詞,其重要性不言而喻。
在博士研究期間,比魯利設計出一個複雜的人工智慧模型,該模型聚焦於三大關鍵技術。他運用了自動語音識別(ASR)技術,將霍語口語轉錄成文字;採用命名實體識別(Entity Recognition)來對詞彙類型進行分類;並實施了詞性標註(POS Tagging)以深入分析其語法結構。為了訓練這套模型,他轉換了約20,000個霍語句子作為數據集。這些訓練數據是使用獨特的瓦朗·克希蒂文字(Warang Kshiti)記錄的。瓦朗·克希蒂文字是由拉科·博德拉(Lako Bodra)所創立的原始書寫系統,母語使用者普遍偏好使用它,而非基於天城文或拉丁字母的變體。
比魯利的這項工作,有力地回應了現存的偏見,旨在提升霍語在數位空間中的重要性與地位。這位學者計劃向印度部落事務部(Ministry of Tribal Affairs of India)提出建議,希望將他開發的AI模型整合到政府的數位平臺中。他積極爭取將霍語納入「阿迪瓦尼」(Adi Vaani)等應用程式——該程式目前已支援貢迪語、比爾語、蒙達里語和桑塔利語等語言——同時也希望將其整合至Google翻譯。若此專案能成功實施,將為印度境內部落語言的數位能見度與尊嚴樹立一個關鍵的先例,為這些語言傳承給後代開闢全新的前景。