BharatGen de India Presenta Modelos Multimodales en IIT Bombay como Activo Soberano
Editado por: Vera Mo
El 25 de noviembre de 2025, el Dr. Jitendra Singh, Ministro de Estado (con encargo independiente) de Ciencia y Tecnología, supervisó el avance de 'BharatGen' en el Instituto Indio de Tecnología (IIT) Bombay, consolidando el esfuerzo soberano de la nación para desarrollar un Modelo de Lenguaje Grande (LLM) multimodal.
El Profesor Ganesh Ramakrishnan, Profesor a Cargo de BharatGen, explicó el funcionamiento de este modelo, concebido como un recurso nacional de Inteligencia Artificial alineado con la visión del Primer Ministro Narendra Modi de fomentar una tecnología arraigada en las fortalezas culturales y lingüísticas de la India. El proyecto está diseñado para integrar la vasta diversidad lingüística y cultural del país, ofreciendo soporte para más de las veintidós lenguas programadas. Su arquitectura abarca tres modalidades principales: procesamiento de texto, reconocimiento y síntesis de voz, y visión documental, permitiendo una interacción ciudadana en sus formas de comunicación más naturales.
Esta iniciativa se financia bajo la Misión Nacional sobre Sistemas Ciberfísicos Interdisciplinarios (NM-ICPS) del Departamento de Ciencia y Tecnología (DST), con una inversión inicial de 235 millones de rupias canalizada a través del Centro de Innovación Tecnológica en el IIT Bombay. El respaldo gubernamental se ha incrementado con una asignación adicional de 1.058 millones de rupias proveniente del Ministerio de Electrónica y Tecnología de la Información (MeitY) bajo la Misión India AI, elevando el apoyo total a 1.293 millones de rupias. El consorcio BharatGen es una estructura colaborativa que incluye instituciones de élite como el IIT Madras, IIIT Hyderabad, IIT Kanpur, IIT Mandi, IIM Indore y IIIT Delhi.
Durante la revisión se presentaron modelos clave que demuestran la capacidad multimodal del proyecto. Entre ellos se encontraba Param-1, un modelo fundacional de texto con 2.900 millones de parámetros, entrenado con 7.5 billones de tokens, de los cuales más de un tercio consistía en contenido indio específico, destacando su tokenizador sensible al guion para las escrituras índicas. Adicionalmente, se exhibieron Shrutam, un sistema de Reconocimiento Automático de Voz (ASR) de 30 millones de parámetros, y Sooktam, un modelo de Texto a Voz (TTS) de 150 millones de parámetros disponible en nueve lenguas índicas. India también ha desarrollado su primer modelo de visión documental, Patram, que cuenta con siete mil millones de parámetros y fue entrenado con 2.500 millones de tokens para interpretar documentos complejos con formatos indios.
Se demostraron aplicaciones de prueba de concepto como Krishi Sathi, una herramienta activada por voz a través de WhatsApp diseñada para asesorar a los agricultores. Un elemento fundamental explicado fue Bharat Data Sagar, un repositorio de conocimiento digital desarrollado para asegurar la propiedad y el control total de la India sobre sus recursos digitales, fortaleciendo la soberanía digital de la nación. Este enfoque busca reducir la dependencia de tecnologías foráneas y construir una pila de IA soberana adaptada a las necesidades nacionales, incluyendo el desarrollo de modelos multimodales que podrían alcanzar hasta un billón de parámetros en fases posteriores.
Fuentes
newKerala.com
Jammu Kashmir Latest News | Tourism | Breaking News J&K
ANI News
PIB Delhi
Indian PSU | Public Sector Undertaking News
The Economic Times
ET Edge Insights
ANI News
BABL AI
PIB Delhi
PIB Delhi
Lea más noticias sobre este tema:
¿Encontró un error o inexactitud?
Consideraremos sus comentarios lo antes posible.
