29 वर्षीय युवा शोधकर्ता बिक्रम बिरुली, जो ओडिशा के मयूरभंज जिले के आदिवासी हो मटकम साही गाँव के मूल निवासी हैं, ने कृत्रिम बुद्धिमत्ता (AI) तकनीक का उपयोग करके हो भाषा के संरक्षण की दिशा में किए गए अपने अभूतपूर्व कार्य के लिए प्रशंसा अर्जित की है। उनकी यह पहल स्पष्ट रूप से दर्शाती है कि आधुनिक तकनीकी उपकरण किस प्रकार प्राचीन सांस्कृतिक विरासत को सहारा और मजबूती प्रदान कर सकते हैं। बिरुली ने सितंबर 2025 में ओडिशा के कलिंग सामाजिक विज्ञान संस्थान (KiSS) से अपनी डॉक्टरेट की उपाधि पूरी की। इस उपलब्धि के साथ, वे हो समुदाय के पहले ऐसे शोधकर्ता बन गए हैं जिन्होंने भाषाई संरक्षण के लिए AI का प्रयोग किया है।
बिरुली की यह प्रेरणादायक यात्रा उनके व्यक्तिगत अनुभवों से शुरू हुई। वे याद करते हैं कि कैसे बचपन में मवेशी चराते हुए भी वे अपनी मातृभाषा सीखने के लिए स्लेट पर खड़िया से लिखकर अभ्यास करते थे। संस्कृति में यह गहन जुड़ाव ही उनके महत्वाकांक्षी प्रोजेक्ट का आधार बना, जिसका मुख्य लक्ष्य हो भाषा के शब्दों को अंग्रेजी या हिंदी के समान मशीन द्वारा पहचानने योग्य बनाना है। हो भाषा ऑस्ट्रोएशियाई परिवार से संबंधित है। 2011 की जनगणना के अनुसार, लगभग 1.4 मिलियन लोग मुख्य रूप से झारखंड और ओडिशा में यह भाषा बोलते हैं। हालांकि 2011 में इसे झारखंड में 'दूसरी आधिकारिक भाषा' का दर्जा मिला, लेकिन यह अब भी भारत के संविधान की आठवीं अनुसूची में शामिल नहीं है, जिसके कारण इसे सर्वोच्च सरकारी सुरक्षा प्राप्त नहीं हो पाती है। समुदाय के कई सदस्यों के लिए, यह भाषा उनके अस्तित्व और सामूहिक स्मृति का पर्याय है।
अपने डॉक्टरेट अनुसंधान के तहत, बिरुली ने एक जटिल AI मॉडल विकसित किया जो तीन प्रमुख तकनीकी पहलुओं पर केंद्रित था। उन्होंने मौखिक रूप से बोली जाने वाली हो भाषा को पाठ में बदलने के लिए स्वचालित वाक् पहचान (ASR) तकनीक का उपयोग किया। इसके अतिरिक्त, उन्होंने शब्दों के प्रकारों को वर्गीकृत करने के लिए नामित इकाई पहचान (Entity Recognition) का प्रयोग किया, और व्याकरणिक संरचनाओं का विश्लेषण करने के लिए पद के भाग टैगिंग (POS Tagging) का इस्तेमाल किया। इस मॉडल को प्रशिक्षित करने के उद्देश्य से, हो भाषा के लगभग 20,000 वाक्यों को रूपांतरित किया गया, जिन्हें विशेष रूप से अनूठी वारंग क्षिति लिपि का उपयोग करके रिकॉर्ड किया गया था। वारंग क्षिति, लाको बोदरा द्वारा बनाई गई एक स्वदेशी लेखन प्रणाली है, जिसे इस भाषा के वक्ता देवनागरी या लैटिन आधारित विकल्पों पर प्राथमिकता देते हैं।
बिरुली का यह शोध कार्य डिजिटल क्षेत्र में भाषा के महत्व को बढ़ाने की दिशा में मौजूदा रूढ़िवादिता का एक सशक्त जवाब है। वैज्ञानिक की भावी योजना है कि वे अपनी AI मॉडल को सरकारी डिजिटल प्लेटफॉर्मों में एकीकृत करने के प्रस्ताव के साथ भारत के जनजातीय मामलों के मंत्रालय से संपर्क करें। उनका अंतिम लक्ष्य हो भाषा को गूगल ट्रांसलेट के साथ-साथ 'आदि वाणी' जैसे अनुप्रयोगों में शामिल करना है, जो पहले से ही गोंडी, भीली, मुंडारी और संताली जैसी भाषाओं का समर्थन करता है। इस परियोजना का सफल कार्यान्वयन देश में जनजातीय भाषाओं की डिजिटल दृश्यता और गरिमा के लिए एक महत्वपूर्ण मिसाल कायम कर सकता है, जिससे इन भाषाओं को भावी पीढ़ियों तक हस्तांतरित करने के लिए नए और व्यापक क्षितिज खुलेंगे।