インド主権AI「BharatGen」、IITボンベイでマルチモーダルモデルを公開

編集者: Vera Mo

2025年11月25日、科学技術担当国務大臣(独立担当)のジットエンドラ・シン博士は、インド初の主権的LLM創出を目指す「BharatGen」の進捗状況をインド工科大学ボンベイ校(IITボンベイ)にて精査した。この国家的なAI資産の機能については、BharatGenの担当教授であるガネーシュ・ラマクリシュナン教授が詳細なプレゼンテーションを実施した。この取り組みは、インドの技術的自立とデジタル主権の確立に向けた戦略的柱の一つとして位置づけられている。

BharatGenは、インドの言語的、文化的、社会的多様性を反映するように設計されており、22以上のインド諸語をサポートする。テキスト、音声、ドキュメントビジョンの三つの主要なモダリティを統合することで、インド国民が日常的に用いるコミュニケーション様式での情報処理を可能にする。この構想は、ナレンドラ・モディ首相が掲げる、インドの強みに根ざした技術のビジョンと完全に一致している。

本プロジェクトは、科学技術省(DST)の学際的サイバーフィジカルシステム国家ミッション(NM-ICPS)に基づき支援されており、IITボンベイの技術革新ハブを通じて2億3500万ルピーが投入されている。さらに、電子情報技術省(MeitY)は、インドAIミッションの下で10億5800万ルピーという追加支援を確保しており、この国家プロジェクトの規模を拡大させている。これら政府支援の総額は12億9300万ルピーに上る。

レビューされた主要モデル群には、29億パラメータを持つ基盤テキストモデルであるParam-1が含まれる。これは7.5兆トークンで訓練され、そのデータセットの3分の1以上がインド固有のコンテンツで構成されている。また、3000万パラメータの自動音声認識(ASR)システムであるShrutam、および9つのインド諸語で利用可能な1億5000万パラメータのテキスト・ツー・スピーチ(TTS)モデルSooktamも提示された。

インド初のドキュメントビジョンモデルであるPatramは70億パラメータを有し、25億トークンで訓練され、インド特有の複雑な文書を解釈する能力を持つ。デモンストレーションでは、農家向けの音声対応WhatsAppツールであるKrishi Sathiなどの概念実証アプリケーションが披露された。これらの技術は、農業、ガバナンス、教育といった重要分野における地域特化型AIソリューション提供を目指す。

デジタル主権の強化に不可欠な要素として、インドのデジタル知識資源に対する完全な所有権と管理を保証するために開発されたBharat Data Sagarが説明された。これは、インドの言語、文化、遺産に焦点を当てた世界最大級のデータセット構築を目指す取り組みである。このコンソーシアム構造には、IITマドラス、IIITハイデラバード、IITカンプールといったインドの主要な教育機関が参画しており、インドの現実と文化的機微を捉えたデータセット構築を推進している。この取り組みは、西欧中心のAI開発に対抗する重要な軸となり、インドのAIエコシステムを加速させることを目的としている。

ソース元

  • newKerala.com

  • Jammu Kashmir Latest News | Tourism | Breaking News J&K

  • ANI News

  • PIB Delhi

  • Indian PSU | Public Sector Undertaking News

  • The Economic Times

  • ET Edge Insights

  • ANI News

  • BABL AI

  • PIB Delhi

  • PIB Delhi

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。