Індія презентує багатомодальні мовні моделі в рамках ініціативи «BharatGen» на базі IIT Бомбей

09:24, 26 листопада

Відредаговано: Vera Mo

У понеділок, 25 листопада 2025 року, Союзний міністр штату з науки та технологій, доктор Джітендра Сінґх, провів огляд прогресу проєкту «BharatGen» в Індійському технологічному інституті (IIT) Бомбей. Цей проєкт позиціонується як перша суверенна спроба Індії створити велику мовну модель (LLM) на національному рівні. Професор Ганеш Рамакрішнан, відповідальний професор «BharatGen», представив функціональність моделі як майбутнього національного активу у сфері штучного інтелекту, що узгоджується з баченням Прем'єр-міністра Нарендри Моді щодо технологій, які ґрунтуються на сильних сторонах Індії.

Ініціатива «BharatGen», яка офіційно стартувала у жовтні 2024 року, розроблена з метою відображення лінгвістичного, культурного та соціального розмаїття Індії, підтримуючи понад двадцять дві індійські мови. Модель інтегрує три основні модальності: текст, мовлення та візуалізацію документів, що дозволяє їй обробляти інформацію відповідно до повсякденного спілкування громадян. Загальна державна підтримка проєкту сягнула 1 293 мільйонів рупій, включаючи 235 мільйонів рупій, виділених через Технологічний інноваційний хаб при IIT Бомбей у рамках Національної місії з міждисциплінарних кіберфізичних систем (NM-ICPS), та додаткові 1 058 мільйонів рупій від Міністерства електроніки та інформаційних технологій (MeitY) у рамках Місії «India AI».

Консорціум, очолюваний IIT Бомбей, включає такі провідні установи, як IIT Мадрас, IIIT Хайдарабад та IIT Канпур, що сигналізує про нову еру спільної, місійно-орієнтованої дослідницької роботи. Серед ключових представлених моделей — Param-1, базова текстова модель із 2,9 мільярда параметрів, навчена на 7,5 трильйонах токенів, де понад третина даних — це індійський контент, причому 25% навчальних даних припадає на гінді. Також були представлені Shrutam, система автоматичного розпізнавання мовлення (ASR) із 30 мільйонами параметрів, та Sooktam, модель перетворення тексту в мовлення (TTS) із 150 мільйонами параметрів, доступна дев'ятьма мовами Індії.

Крім того, було представлено Patram, першу в Індії модель для роботи з документами, яка має сім мільярдів параметрів і навчена на 2,5 мільярдах токенів для інтерпретації складних документів у індійських форматах. Важливим елементом для забезпечення цифрової суверенності є Bharat Data Sagar, репозиторій даних, розроблений для гарантування повного володіння та контролю Індії над своїми цифровими знаннями, зосереджений на недостатньо представлених індійських даних. Продемонстровано приклади застосування, зокрема Krishi Sathi, інструмент для фермерів через WhatsApp з голосовим керуванням.

Ініціатива «BharatGen» активно працює над створенням екосистеми партнерів, залучаючи компанії, як-от IBM та Zoho, а також співпрацюючи з державними структурами. Проєкт інвестує у розвиток талантів через фінансування програм MTech/PhD та хакатони, закріплюючи позиції Індії як світового лідера у сфері ШІ, спрямованого на формування інклюзивного та орієнтованого на Індію цифрового майбутнього.