L'Initiative BharatGen Présente ses Modèles d'IA Multimodaux à l'IIT Bombay

Édité par : Vera Mo

Le 25 novembre 2025, le Dr Jitendra Singh, Ministre d'État (Charge Indépendante) pour la Science et la Technologie, a examiné les progrès de l'initiative souveraine indienne 'BharatGen' sur le campus de l'IIT Bombay. Cette initiative constitue la première tentative nationale pour développer un Modèle de Langage Étendu (LLM) souverain, s'inscrivant dans la stratégie d'autonomie technologique du pays.

Le Professeur Ganesh Ramakrishnan, responsable de BharatGen à l'IIT Bombay, a présenté l'architecture de cette plateforme numérique nationale, conçue pour intégrer la diversité linguistique et culturelle de l'Inde en prenant en charge plus de vingt-deux langues indiennes. Le système intègre nativement trois modalités principales: le traitement du texte, la reconnaissance et la synthèse vocale, ainsi que la vision documentaire, visant à faciliter une interaction naturelle avec les citoyens.

Le financement de ce projet est assuré par le Département des Systèmes Cyber-Physiques Interdisciplinaires (NM-ICPS) sous l'égide du Département des Sciences et Technologies (DST), avec une injection initiale de 235 crores de roupies via le Hub d'Innovation Technologique de l'IIT Bombay. Un soutien additionnel substantiel de 1 058 crores de roupies a été sécurisé auprès du Ministère de l'Électronique et des Technologies de l'Information (MeitY) dans le cadre de la Mission India AI, faisant de BharatGen le bénéficiaire principal de cette mission dotée d'un budget global de 1 500 crores de roupies.

L'écosystème de modèles fondamentaux présenté comprend Param-1, un LLM textuel de 2,9 milliards de paramètres entraîné sur 7,5 billions de tokens, dont plus d'un tiers est constitué de contenu indien. Il est complété par Shrutam, un système de Reconnaissance Automatique de la Parole (ASR) de 30 millions de paramètres, et Sooktam, un modèle de Synthèse Vocale (TTS) de 150 millions de paramètres, déjà fonctionnel dans neuf langues. S'y ajoute Patram, le premier modèle de vision documentaire de l'Inde, doté de sept milliards de paramètres et entraîné sur 2,5 milliards de tokens pour interpréter les documents aux formats indiens.

Des applications pratiques ont été démontrées, notamment Krishi Sathi, un outil vocal accessible via WhatsApp pour l'assistance aux agriculteurs. Un élément clé est également Bharat Data Sagar, une plateforme de données développée pour garantir à l'Inde la pleine propriété et le contrôle de ses ressources numériques. La structure collaborative de BharatGen fédère des institutions telles que l'IIT Madras, l'IIIT Hyderabad et l'IIT Kanpur, consolidant une base essentielle pour l'ambition nationale de développer des modèles multimodaux pouvant atteindre un trillion de paramètres.

Sources

  • newKerala.com

  • Jammu Kashmir Latest News | Tourism | Breaking News J&K

  • ANI News

  • PIB Delhi

  • Indian PSU | Public Sector Undertaking News

  • The Economic Times

  • ET Edge Insights

  • ANI News

  • BABL AI

  • PIB Delhi

  • PIB Delhi

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.