印度主權AI計畫「BharatGen」於孟買理工學院展示多模態模型進展

09:24, 26 十一月

编辑者： Vera Mo

印度科技國務部長（獨立職務）吉特恩德拉·辛格博士於2025年11月25日視察了孟買理工學院（IIT Bombay），檢閱了印度首個主權級別大型語言模型（LLM）計畫「BharatGen」的最新進展。負責該計畫的孟買理工學院教授加尼許·拉馬克里希南向部長詳細說明了此國家級AI基礎設施的運作藍圖，該基礎設施旨在體現印度的語言、文化與社會多元性，目前已能支援超過二十二種印度本地語言的運作。

BharatGen的架構整合了文本、語音和文件視覺三大模態，以期能以印度公民的自然溝通方式處理資訊，此方向呼應了總理納倫德拉·莫迪關於技術應植根於印度自身優勢的願景。此關鍵計畫在科學技術部（DST）的跨學科網路物理系統國家任務（NM-ICPS）支持下，透過孟買理工學院的技術創新中心撥付了235億盧比的資金。此外，電子和資訊技術部（MeitY）在「印度AI任務」（India AI Mission）框架下，額外提供了高達1,058億盧比的支持，以鞏固整體政府投入。

審查的關鍵模型包括旗艦級的基礎文本模型Param-1，該模型擁有29億參數，在7.5兆個數據標記上進行了訓練，其中超過三分之一的數據內容源自印度本土資料。為確保印度對其數位知識資源的自主權，Bharat Data Sagar的開發被視為強化國家數位主權的關鍵組成部分。該財團結構匯集了包括馬德拉斯理工學院（IIT Madras）、海德拉巴國際資訊技術學院（IIIT Hyderabad）和坎普爾理工學院（IIT Kanpur）在內的多個頂尖學術機構共同推動專案發展。

在語音與視覺處理方面，團隊展示了擁有3,000萬參數的自動語音識別系統Shrutam，以及擁有1.5億參數、已在九種印度主要語言中投入使用的文本轉語音模型Sooktam。印度首個文件視覺模型Patram也已亮相，該模型具備70億參數，並在25億數據標記上進行了訓練，專門用於解析複雜的印度格式文件。為驗證其實用性，現場演示了如Krishi Sathi等概念驗證應用，這是一個專為農民設計的語音啟用WhatsApp工具，旨在提供即時農業指導。

BharatGen的發展戰略強調技術在農業、醫療保健、治理、金融和教育等國家關鍵領域的應用落地，以確保AI技術的普及性與包容性。該計畫採納了公私學夥伴關係（PPP）模式，合作夥伴涵蓋IBM、Zoho和NASSCOM等業界機構，以及多個政府部門和邦政府，以加速本土AI生態系統的建設。拉馬克里希南教授指出，BharatGen的目標是建立一個反映印度多樣性、具備全球競爭力的AI基礎設施，並將其作為公共財惠及所有公民。該計畫的總體路線圖規劃至2026年7月，旨在推動AI在各行業和公共倡議中的規模化應用。