Le jeune chercheur Bikram Biruli, âgé de 29 ans, originaire du village Adivasi Ho Matkam Sahi dans le district de Mayurbhanj, Odisha, a récemment été salué pour son travail pionnier dans la préservation de la langue Ho grâce à l'application des technologies d'intelligence artificielle. Son engagement profond envers la conservation du patrimoine culturel illustre de manière éclatante comment les outils contemporains peuvent être mis au service des traditions ancestrales. En septembre 2025, Biruli a achevé son doctorat à l'Institut des sciences sociales de Kalinga (KiSS) à Odisha, marquant ainsi une étape historique : il est devenu le premier chercheur issu de la communauté Ho à mobiliser l'IA pour la conservation linguistique.
Le parcours de Biruli est enraciné dans une expérience personnelle marquante. Il se souvient d'avoir gardé le bétail tout en apprenant sa langue maternelle en utilisant de la craie sur une ardoise. Cette immersion culturelle a jeté les bases de son projet ambitieux : permettre la reconnaissance automatique des mots de son peuple par les machines, au même titre que l'anglais ou l'hindi. La langue Ho appartient à la famille austroasiatique. Selon le recensement de 2011, environ 1,4 million de personnes la parlent, principalement dans les États du Jharkhand et d'Odisha. Bien qu'elle ait obtenu le statut de « deuxième langue officielle » au Jharkhand en 2011, elle n'est toujours pas inscrite dans la Huitième Annexe de la Constitution indienne, ce qui la prive d'une protection étatique supérieure. Pour de nombreux membres de cette communauté, la langue est intrinsèquement liée à la survie et à la mémoire identitaire de leur peuple.
Dans le cadre de sa thèse de doctorat, Biruli a conçu un modèle d'IA sophistiqué articulé autour de trois axes fondamentaux. Il a utilisé la technologie de reconnaissance automatique de la parole (ASR) pour transcrire le discours oral Ho en texte écrit. Il a également intégré la reconnaissance d'entités nommées (Entity Recognition) afin de catégoriser les types de mots, et le marquage des parties du discours (POS Tagging) pour analyser les structures grammaticales complexes. Pour l'entraînement de ce modèle, près de 20 000 phrases en langue Ho ont été traitées. Ces données ont été enregistrées en utilisant l'écriture unique Warang Kshiti. Le Warang Kshiti est un système d'écriture original créé par Lako Bodra, et il est préféré par les locuteurs natifs aux variantes basées sur le Devanagari ou l'alphabet latin.
Le travail de Biruli constitue une réponse puissante aux stéréotypes existants, visant à rehausser la visibilité et l'importance de la langue Ho dans l'espace numérique. L'universitaire prévoit de soumettre une proposition au Ministère indien des Affaires tribales afin d'intégrer son modèle d'IA aux plateformes numériques gouvernementales. Son objectif est d'inclure la langue Ho dans des applications existantes, comme Adi Vaani, qui prend déjà en charge des langues telles que le Gondi, le Bhili, le Mundari et le Santali, ainsi que dans Google Translate. La concrétisation de ce projet pourrait établir un précédent majeur pour la dignité et la visibilité numérique des langues tribales à travers le pays, ouvrant de nouveaux horizons pour leur transmission aux générations futures.