印度主權AI計畫「BharatGen」於孟買理工學院展示多模態模型進展
编辑者: Vera Mo
印度科技國務部長(獨立職務)吉特恩德拉·辛格博士於2025年11月25日視察了孟買理工學院(IIT Bombay),檢閱了印度首個主權級別大型語言模型(LLM)計畫「BharatGen」的最新進展。負責該計畫的孟買理工學院教授加尼許·拉馬克里希南向部長詳細說明了此國家級AI基礎設施的運作藍圖,該基礎設施旨在體現印度的語言、文化與社會多元性,目前已能支援超過二十二種印度本地語言的運作。
BharatGen的架構整合了文本、語音和文件視覺三大模態,以期能以印度公民的自然溝通方式處理資訊,此方向呼應了總理納倫德拉·莫迪關於技術應植根於印度自身優勢的願景。此關鍵計畫在科學技術部(DST)的跨學科網路物理系統國家任務(NM-ICPS)支持下,透過孟買理工學院的技術創新中心撥付了235億盧比的資金。此外,電子和資訊技術部(MeitY)在「印度AI任務」(India AI Mission)框架下,額外提供了高達1,058億盧比的支持,以鞏固整體政府投入。
審查的關鍵模型包括旗艦級的基礎文本模型Param-1,該模型擁有29億參數,在7.5兆個數據標記上進行了訓練,其中超過三分之一的數據內容源自印度本土資料。為確保印度對其數位知識資源的自主權,Bharat Data Sagar的開發被視為強化國家數位主權的關鍵組成部分。該財團結構匯集了包括馬德拉斯理工學院(IIT Madras)、海德拉巴國際資訊技術學院(IIIT Hyderabad)和坎普爾理工學院(IIT Kanpur)在內的多個頂尖學術機構共同推動專案發展。
在語音與視覺處理方面,團隊展示了擁有3,000萬參數的自動語音識別系統Shrutam,以及擁有1.5億參數、已在九種印度主要語言中投入使用的文本轉語音模型Sooktam。印度首個文件視覺模型Patram也已亮相,該模型具備70億參數,並在25億數據標記上進行了訓練,專門用於解析複雜的印度格式文件。為驗證其實用性,現場演示了如Krishi Sathi等概念驗證應用,這是一個專為農民設計的語音啟用WhatsApp工具,旨在提供即時農業指導。
BharatGen的發展戰略強調技術在農業、醫療保健、治理、金融和教育等國家關鍵領域的應用落地,以確保AI技術的普及性與包容性。該計畫採納了公私學夥伴關係(PPP)模式,合作夥伴涵蓋IBM、Zoho和NASSCOM等業界機構,以及多個政府部門和邦政府,以加速本土AI生態系統的建設。拉馬克里希南教授指出,BharatGen的目標是建立一個反映印度多樣性、具備全球競爭力的AI基礎設施,並將其作為公共財惠及所有公民。該計畫的總體路線圖規劃至2026年7月,旨在推動AI在各行業和公共倡議中的規模化應用。
來源
newKerala.com
Jammu Kashmir Latest News | Tourism | Breaking News J&K
ANI News
PIB Delhi
Indian PSU | Public Sector Undertaking News
The Economic Times
ET Edge Insights
ANI News
BABL AI
PIB Delhi
PIB Delhi
发现错误或不准确的地方吗?
我们会尽快处理您的评论。
