Молодой исследователь Бикрам Бирули, 29-летний уроженец деревни Адиваси Хо Маткам Сахи в округе Маюрбханд, штат Одиша, получил признание за новаторскую работу по сохранению языка Хо с помощью технологий искусственного интеллекта. Его стремление к сохранению культурного наследия демонстрирует, как современные инструменты могут поддержать древние традиции. В сентябре 2025 года Бирули завершил докторантуру в Институте социальных наук Калинга (KiSS) в Одише, став первым исследователем из народа Хо, применившим ИИ для лингвистической консервации.
Путь Бирули начался с личного опыта: он вспоминал, как пас скот, делая записи мелом на грифельной доске для изучения родного языка. Это погружение в культуру легло в основу его амбициозного проекта, цель которого — добиться машинного распознавания слов его народа наравне с английским или хинди. Язык Хо относится к австроазиатской семье, и, согласно переписи 2011 года, на нем говорят около 1,4 миллиона человек, преимущественно в Джаркханде и Одише. Несмотря на то что в 2011 году язык получил статус «второго официального языка» в Джаркханде, он до сих пор не включен в Восьмое приложение Конституции Индии, что лишает его высшей государственной защиты. Для многих представителей общины язык является синонимом выживания и памяти народа.
В рамках своего докторского исследования Бирули разработал сложную модель ИИ, сфокусированную на трех ключевых аспектах. Он использовал технологию автоматического распознавания речи (ASR) для транскрипции устной речи Хо в текст, распознавание именованных сущностей (Entity Recognition) для категоризации типов слов, а также тегирование частей речи (POS Tagging) для анализа грамматических структур. Для обучения модели было преобразовано около 20 000 предложений на языке Хо, записанных с использованием уникального письма Варанг Кшити. Варанг Кшити — это оригинальная система письма, созданная Лако Бодрой, которую носители языка предпочитают вариантам на основе Деванагари или Латиницы.
Работа Бирули служит мощным ответом на существующие стереотипы, направленным на повышение значимости языка в цифровом пространстве. В планах ученого — обратиться в Министерство по делам племен Индии с предложением об интеграции его ИИ-модели в государственные цифровые платформы. Он стремится включить язык Хо в такие приложения, как Adi Vaani, которое уже поддерживает такие языки, как Гонди, Бхили, Мундари и Сантали, а также в Google Translate. Успешная реализация этого проекта может создать прецедент для цифровой видимости и достоинства племенных языков в стране, открывая новые горизонты для их передачи будущим поколениям.