Дослідник з Одіші Бікрам Бірулі застосував ШІ для збереження мови Хо

Відредаговано: Vera Mo

Молодий науковець Бікрам Бірулі, уродженець села Адівасі Хо Маткам Сахі в окрузі Маюрбханд, штат Одіша, здобув широке визнання завдяки своїй новаторській роботі. Цей 29-річний дослідник успішно використав технології штучного інтелекту (ШІ) для збереження мови Хо. Його прагнення захистити культурну спадщину є яскравим прикладом того, як інноваційні інструменти можуть підтримати багатовікові традиції. У вересні 2025 року Бірулі завершив докторантуру в Інституті соціальних наук Калінга (KiSS) в Одіші. Він став першим дослідником із народу Хо, який застосував ШІ для лінгвістичної консервації, відкриваючи нові горизонти для своєї спільноти.

Шлях Бірулі до цього проекту розпочався з глибоко особистого досвіду. Він згадує, як у дитинстві, пасучи худобу, використовував крейду та грифельну дошку, щоб вивчати рідну мову. Це культурне занурення стало основою його амбітної мети: забезпечити машинне розпізнавання слів його народу нарівні з такими поширеними мовами, як англійська чи гінді. Мова Хо належить до австроазіатської сім'ї. Згідно з переписом 2011 року, нею розмовляють близько 1,4 мільйона осіб, переважно в індійських штатах Джаркханд та Одіша. Хоча в 2011 році мова отримала статус «другої офіційної мови» в Джаркханді, вона досі не включена до Восьмого додатку Конституції Індії. Ця відсутність вищого державного захисту створює значні виклики. Для багатьох представників громади мова Хо є синонімом виживання та колективної пам'яті народу.

У рамках свого докторського дослідження Бірулі розробив складну модель ШІ, яка охоплює три ключові аспекти обробки мови. По-перше, він застосував технологію автоматичного розпізнавання мовлення (ASR) для перетворення усного мовлення Хо на текст. По-друге, використовувалося розпізнавання іменованих сутностей (Entity Recognition) для ефективної категоризації типів слів. І, по-третє, було задіяно тегування частин мови (POS Tagging) для детального аналізу граматичних структур. Для навчання цієї моделі було опрацьовано близько 20 000 речень мовою Хо. Ці дані були записані з використанням унікального письма Варанг Кшиті. Важливо зазначити, що Варанг Кшиті — це оригінальна система письма, створена Лако Бодрою, яку носії мови віддають перевагу перед варіантами на основі Деванагарі чи Латиниці.

Розробка Бірулі є потужною відповіддю на існуючі стереотипи, спрямованою на підвищення значущості мови Хо у цифровому просторі. Вчений планує звернутися до Міністерства у справах племен Індії з пропозицією інтегрувати його інноваційну ШІ-модель у державні цифрові платформи. Він прагне, щоб мова Хо була включена до таких додатків, як Adi Vaani, який вже підтримує інші племінні мови, зокрема Гонді, Бхілі, Мундарі та Санталі, а також до Google Translate. Успішна реалізація цього проекту може створити важливий прецедент для забезпечення цифрової видимості та гідності племінних мов у країні, відкриваючи нові можливості для їхньої передачі наступним поколінням.

Джерела

  • The Indian Express

  • From grazing cattle to training AI: How a Ho scholar is digitally reviving his mother tongue

  • He Once Grazed Cattle — Now He’s Using AI to Save His Mother Tongue

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.