Tiến sĩ Singh Đánh giá Tiến độ 'BharatGen', Mô hình Ngôn ngữ Đa phương thức Chủ quyền của Ấn Độ tại IIT Bombay

09:24, 26 tháng 11

Chỉnh sửa bởi: Vera Mo

Vào ngày 25 tháng 11 năm 2025, Tiến sĩ Jitendra Singh, Bộ trưởng Quốc vụ (Phụ trách Độc lập) về Khoa học & Công nghệ, đã xem xét tiến độ của 'BharatGen' tại IIT Bombay, dự án được mô tả là nỗ lực chủ quyền đầu tiên của Ấn Độ nhằm tạo ra Mô hình Ngôn ngữ Lớn (LLM) đa phương thức và đa ngôn ngữ do AI điều khiển. Giáo sư Ganesh Ramakrishnan, Giáo sư phụ trách BharatGen, đã trình bày chi tiết về hoạt động của mô hình này như một tài sản AI quốc gia cho tương lai, nhấn mạnh vai trò của nó trong việc định hình quản trị và đổi mới trong thập kỷ kỹ thuật số.

Sáng kiến BharatGen, được dẫn dắt bởi IIT Bombay, là một phần của nỗ lực rộng lớn hơn nhằm phát triển công nghệ tự chủ của Ấn Độ, phù hợp với tầm nhìn của Thủ tướng Narendra Modi về công nghệ bắt nguồn từ thế mạnh của quốc gia. Mô hình này được thiết kế để phản ánh sự đa dạng về ngôn ngữ, văn hóa và xã hội của Ấn Độ, hỗ trợ hơn hai mươi hai ngôn ngữ Ấn Độ, bao gồm cả các phương ngữ. BharatGen tích hợp ba chế độ chính—văn bản, giọng nói và thị giác tài liệu—cho phép nó xử lý thông tin theo cách công dân Ấn Độ giao tiếp tự nhiên.

Dự án nhận được sự hỗ trợ tài chính đáng kể từ chính phủ. Ban đầu, dự án được hỗ trợ theo Sáng kiến Hệ thống Vật lý Không gian mạng Liên ngành Quốc gia (NM-ICPS) của Bộ Khoa học và Công nghệ (DST), với 235 crore Rupee được chuyển qua Trung tâm Đổi mới Công nghệ tại IIT Bombay. Gần đây, khoản hỗ trợ bổ sung 1.058 crore Rupee đã được đảm bảo từ Bộ Điện tử và Công nghệ Thông tin (MeitY) theo Sứ mệnh AI Ấn Độ, nâng tổng hỗ trợ của chính phủ lên 1.293 crore Rupee. Khoản tài trợ này sẽ giúp BharatGen phát triển các mô hình AI nền tảng quy mô lớn, bao gồm các Mô hình Ngôn ngữ Lớn và Đa phương thức với tối đa một nghìn tỷ tham số.

Các mô hình quan trọng đã được trình bày bao gồm **Param-1**, một mô hình văn bản nền tảng với 2,9 tỷ tham số, được huấn luyện trên 7,5 nghìn tỷ token, trong đó hơn một phần ba dữ liệu là nội dung Ấn Độ. Ngoài ra, **Shrutam**, một hệ thống Nhận dạng Giọng nói Tự động (ASR) 30 triệu tham số, và **Sooktam**, một mô hình Chuyển văn bản thành Giọng nói (TTS) 150 triệu tham số có sẵn bằng chín ngôn ngữ Ấn Độ, cũng đã được giới thiệu. Mô hình thị giác tài liệu đầu tiên của Ấn Độ, **Patram**, có bảy tỷ tham số, được huấn luyện trên 2,5 tỷ token, nhằm giải thích các tài liệu phức tạp theo định dạng của Ấn Độ. Những mô hình này cùng nhau tạo thành một ngăn xếp AI hoàn chỉnh cho Ấn Độ, có khả năng hỗ trợ quản trị, công nghiệp, giáo dục, nông nghiệp, chăm sóc sức khỏe và hòa nhập kỹ thuật số.

Sự hợp tác đa tổ chức này bao gồm các học viện hàng đầu như IIT Madras, IIIT Hyderabad, IIT Kanpur, IIT Mandi, IIM Indore, IIT Kharagpur và IIIT Delhi. Một thành phần quan trọng được nhấn mạnh là **Bharat Data Sagar**, được phát triển để đảm bảo Ấn Độ sở hữu và kiểm soát hoàn toàn các tài nguyên tri thức kỹ thuật số của mình, củng cố chủ quyền kỹ thuật số. Các ứng dụng bằng chứng về khái niệm như **Krishi Sathi**, một công cụ WhatsApp kích hoạt bằng giọng nói dành cho nông dân, đã được chứng minh, cho thấy tác động thực tế trên các lĩnh vực quan trọng.

Large Language Models (LLMs)

BharatGen

28 Lượt xem

Nguồn

newKerala.com
Jammu Kashmir Latest News | Tourism | Breaking News J&K
ANI News
PIB Delhi
Indian PSU | Public Sector Undertaking News
The Economic Times
ET Edge Insights
ANI News
BABL AI
PIB Delhi
PIB Delhi

Đọc thêm tin tức về chủ đề này:

03 tháng 3

Phim bộ 'The Chosen' lập kỷ lục Guinness mới về số lượng ngôn ngữ dịch thuật

23 tháng 2

Nghiên cứu Nottingham: Đồng bộ Thần kinh Mẹ Song ngữ và Con vẫn Duy trì Qua Các Ngôn ngữ

23 tháng 2

Nghiên cứu Khoa học Thần kinh Đối chiếu Ghi nhớ Giữa Viết Tay và Đánh Máy Giữa Kỷ nguyên AI Tạo sinh

Bạn có phát hiện lỗi hoặc sai sót không?Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.