एनवीडिया ने 'फिजिकल एआई' के लिए ओपन वीएलए रीजनिंग मॉडल अल्पामयो-आर1 (AR1) का अनावरण किया
द्वारा संपादित: Veronika Radoslavskaya
एनवीडिया ने न्यूरआईपीएस (NeurIPS) एआई सम्मेलन में औपचारिक रूप से अल्पामयो-आर1 (AR1) का अनावरण किया है। यह कदम मुख्य कार्यकारी अधिकारी जेन्सेन हुआंग की उस रणनीतिक दिशा का प्रतीक है जिसमें वे 'फिजिकल एआई' पर ध्यान केंद्रित कर रहे हैं। फिजिकल एआई का अर्थ है ऐसी बुद्धिमत्ता का कार्यान्वयन जो सीधे उन मशीनों को नियंत्रित करती है जो भौतिक दुनिया के साथ संवाद करती हैं। AR1 को एक ओपन विज़न-रीज़निंग लैंग्वेज मॉडल (VLA) के रूप में प्रस्तुत किया गया है। इसका उद्देश्य स्वायत्त ड्राइविंग (Autonomous Driving) को केवल कठोर, पूर्व-निर्धारित नियमों से परे ले जाकर मानवीय समझ और सामान्य ज्ञान पर आधारित निर्णय लेने की प्रक्रिया की ओर अग्रसर करना है। यह मॉडल उन शोधकर्ताओं के लिए एक व्यावहारिक मार्ग प्रशस्त करने का लक्ष्य रखता है जो परिभाषित परिस्थितियों में पूर्ण सेल्फ-ड्राइविंग यानी लेवल 4 स्वायत्तता प्राप्त करने की दिशा में प्रयासरत हैं।
इस तकनीकी प्रगति का केंद्र बिंदु AR1 की विज़न-लैंग्वेज-एक्शन (VLA) प्रणाली है। यह पाइपलाइन कैमरों से प्राप्त दृश्य डेटा और प्राकृतिक भाषा इनपुट को एक साथ संसाधित करती है। सबसे महत्वपूर्ण बात यह है कि यह व्याख्या योग्य 'चेन-ऑफ-कजेशन' (कारण-और-प्रभाव श्रृंखला) तर्क को सीधे प्रक्षेप पथ नियोजन (Trajectory Planning) के साथ एकीकृत करती है। इस उन्नत तर्क ढांचे का उपयोग करके, AR1 पारंपरिक एंड-टू-एंड इमिटेशन लर्निंग मॉडलों की ज्ञात कमजोरियों का मुकाबला करता है। ये मॉडल विशेष रूप से अप्रत्याशित और सुरक्षा-महत्वपूर्ण ड्राइविंग स्थितियों में अक्सर विफल हो जाते हैं, जहाँ कारण की समझ सीमित होती है।
AR1 केवल तत्काल उत्तेजनाओं पर प्रतिक्रिया करने के बजाय, जटिल परिस्थितियों का मूल्यांकन करता है और सड़क पर मौजूद अन्य उपयोगकर्ताओं की गतिविधियों का पूर्वानुमान लगाता है। यह व्यवस्थित तर्क दृष्टिकोण चुनौतीपूर्ण सिमुलेशन में केवल प्रक्षेप पथ पर आधारित मॉडलों की तुलना में योजना सटीकता में उल्लेखनीय सुधार प्रदर्शित करता है। साथ ही, वाहन पर किए गए सड़क परीक्षणों में इसने कम विलंबता (Low Latency) के साथ वास्तविक समय का प्रदर्शन भी सफलतापूर्वक दिखाया है। यह दर्शाता है कि यह मॉडल न केवल सोचने में बेहतर है, बल्कि क्रियान्वित करने में भी तीव्र है।
इस आर्किटेक्चर के व्यापक विकास और अपनाने को प्रोत्साहित करने के लिए, एनवीडिया ने साथ ही साथ गिटहब (GitHub) पर 'कॉसमॉस कुकबुक' (Cosmos Cookbook) भी जारी की है। यह व्यापक संसाधन पैकेज आवश्यक गाइड, उपकरण और कार्यप्रवाह प्रदान करता है। इसका उद्देश्य डेवलपर्स को रोबोटिक्स और स्वायत्त प्रणालियों सहित विभिन्न अनुप्रयोगों में मूलभूत कॉसमॉस प्लेटफॉर्म को तैनात करने और फाइन-ट्यून करने में सहायता करना है। मॉडल के वेट्स और उपकरणों की यह रणनीतिक रिलीज़ एनवीडिया को एक मूलभूत प्रौद्योगिकी प्रदाता के रूप में स्थापित करती है। यह कंपनी की उस महत्वाकांक्षा को मजबूत करता है कि उसका हार्डवेयर और सॉफ्टवेयर मशीन इंटरैक्शन के अगले क्रांतिकारी चरण की आधारशिला बने।
संक्षेप में कहें तो, अल्पामयो-आर1 का आगमन एआई के क्षेत्र में एक महत्वपूर्ण मोड़ है। यह मशीन लर्निंग को केवल डेटा प्रोसेसिंग से निकालकर भौतिक दुनिया की जटिलताओं को समझने और उनमें सुरक्षित रूप से हस्तक्षेप करने की दिशा में ले जाता है। यह कदम स्वायत्त वाहनों के भविष्य को आकार देने में एनवीडिया की अग्रणी भूमिका को और पुष्ट करता है, जहाँ निर्णय लेने की प्रक्रिया अब केवल प्रोग्रामिंग पर नहीं, बल्कि समझ पर आधारित होगी।
स्रोतों
Punto Informatico
Nvidia Releases New AI Model Alpamayo-R1, Advancing Autonomous Driving Research
Nvidia Drops Alpamayo R1 As Open Source Leap Toward Level 4 Autonomy
NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025 | AIM
Nvidia lancia modello AI per la guida autonoma Alpamayo-R1
NVIDIA debuts Cosmos Reason AI model to advance physical AI and robotics
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
