Iniciativa Soberana BharatGen Apresenta Modelos Multimodais no IIT Bombay
Editado por: Vera Mo
Em 25 de novembro de 2025, o Dr. Jitendra Singh, Ministro de Estado (com cargo independente) para Ciência e Tecnologia, inspecionou o progresso do projeto BharatGen no Instituto Indiano de Tecnologia de Bombaim (IIT Bombay), um marco no esforço soberano da Índia para desenvolver um Modelo de Linguagem de Grande Escala (LLM). O Professor Ganesh Ramakrishnan, Professor-Responsável pelo BharatGen, detalhou o funcionamento do modelo, posicionando-o como um ativo nacional de Inteligência Artificial fundamental para o futuro tecnológico do país. A iniciativa alinha-se com a visão do Primeiro-Ministro Narendra Modi de ancorar a tecnologia nas capacidades intrínsecas da Índia, visando a liderança global em tecnologias de ponta.
O BharatGen foi concebido para encapsular a vasta tapeçaria linguística, cultural e social da nação indiana, oferecendo suporte a mais de vinte e duas línguas indianas oficiais. Sua arquitetura integra três modalidades principais — texto, fala e visão de documentos — permitindo o processamento e a geração de informações de maneira orgânica para os cidadãos indianos. O financiamento robusto provém de fontes governamentais cruciais: Rs 235 crore foram canalizados através do Centro de Inovação Tecnológica no IIT Bombay, sob a égide da Missão Nacional sobre Sistemas Ciberfísicos Interdisciplinares (NM-ICPS) do Departamento de Ciência e Tecnologia (DST). Adicionalmente, o Ministério de Eletrônica e Tecnologia da Informação (MeitY), por meio da Missão India AI, assegurou um suporte de ₹1.058 crore, totalizando o apoio governamental em Rs 1.293 crore.
Durante a revisão, foram apresentados modelos-chave que demonstram a capacidade multimodal do sistema. O Param-1, um modelo de texto fundamental, possui 2,9 bilhões de parâmetros e foi treinado com 7,5 trilhões de tokens, sendo que mais de um terço desses dados de treinamento representa conteúdo especificamente indiano. Complementando-o, o Shrutam, um sistema de Reconhecimento Automático de Fala (ASR) com 30 milhões de parâmetros, e o Sooktam, um modelo de Texto-para-Fala (TTS) com 150 milhões de parâmetros, já está disponível em nove línguas do subcontinente. O consórcio, liderado pelo IIT Bombay, fortalece sua base com a participação de instituições como IIT Madras, IIIT Hyderabad e IIT Kanpur, sinalizando uma era de pesquisa colaborativa e orientada por missões.
Um marco na área de visão computacional é o Patram, o primeiro modelo de visão de documentos da Índia, com sete bilhões de parâmetros e treinado com 2,5 bilhões de tokens para interpretar documentos complexos em formatos indianos, tornando textos intrincados acessíveis ao cidadão comum. A aplicabilidade prática foi ilustrada por meio de demonstrações de prova de conceito, como o Krishi Sathi, uma ferramenta de consultoria agrícola ativada por voz acessível via WhatsApp, projetada para levar insights em tempo real aos agricultores. Outras aplicações como o e-VikrAI, que gera descrições de produtos a partir de uma imagem, e o Docbodh, que simplifica documentos complexos, também foram exibidas, sublinhando o impacto direto na acessibilidade dos serviços públicos.
Um pilar estratégico para a autonomia digital do país é o Bharat Data Sagar, desenvolvido para garantir que a Índia mantenha total propriedade e controle sobre seus recursos de conhecimento digital. Este repositório de dados soberano é vital para fortalecer a autonomia digital, assegurando que os modelos sejam treinados com dados indianos autênticos e culturalmente ricos, mitigando a dependência de datasets estrangeiros. Além disso, o projeto BharatGen estabeleceu parcerias estratégicas com empresas como IBM e Zoho, e entidades como a NASSCOM, para integrar a experiência de domínio local e acelerar a implantação de soluções em setores críticos.
Fontes
newKerala.com
Jammu Kashmir Latest News | Tourism | Breaking News J&K
ANI News
PIB Delhi
Indian PSU | Public Sector Undertaking News
The Economic Times
ET Edge Insights
ANI News
BABL AI
PIB Delhi
PIB Delhi
Leia mais notícias sobre este tema:
Encontrou um erro ou imprecisão?
Vamos considerar seus comentários assim que possível.
