एनवीडिया ने 'फिजिकल एआई' के लिए ओपन वीएलए रीजनिंग मॉडल अल्पामयो-आर1 (AR1) का अनावरण किया

द्वारा संपादित: Veronika Radoslavskaya

एनवीडिया ने न्यूरआईपीएस (NeurIPS) एआई सम्मेलन में औपचारिक रूप से अल्पामयो-आर1 (AR1) का अनावरण किया है। यह कदम मुख्य कार्यकारी अधिकारी जेन्सेन हुआंग की उस रणनीतिक दिशा का प्रतीक है जिसमें वे 'फिजिकल एआई' पर ध्यान केंद्रित कर रहे हैं। फिजिकल एआई का अर्थ है ऐसी बुद्धिमत्ता का कार्यान्वयन जो सीधे उन मशीनों को नियंत्रित करती है जो भौतिक दुनिया के साथ संवाद करती हैं। AR1 को एक ओपन विज़न-रीज़निंग लैंग्वेज मॉडल (VLA) के रूप में प्रस्तुत किया गया है। इसका उद्देश्य स्वायत्त ड्राइविंग (Autonomous Driving) को केवल कठोर, पूर्व-निर्धारित नियमों से परे ले जाकर मानवीय समझ और सामान्य ज्ञान पर आधारित निर्णय लेने की प्रक्रिया की ओर अग्रसर करना है। यह मॉडल उन शोधकर्ताओं के लिए एक व्यावहारिक मार्ग प्रशस्त करने का लक्ष्य रखता है जो परिभाषित परिस्थितियों में पूर्ण सेल्फ-ड्राइविंग यानी लेवल 4 स्वायत्तता प्राप्त करने की दिशा में प्रयासरत हैं।

इस तकनीकी प्रगति का केंद्र बिंदु AR1 की विज़न-लैंग्वेज-एक्शन (VLA) प्रणाली है। यह पाइपलाइन कैमरों से प्राप्त दृश्य डेटा और प्राकृतिक भाषा इनपुट को एक साथ संसाधित करती है। सबसे महत्वपूर्ण बात यह है कि यह व्याख्या योग्य 'चेन-ऑफ-कजेशन' (कारण-और-प्रभाव श्रृंखला) तर्क को सीधे प्रक्षेप पथ नियोजन (Trajectory Planning) के साथ एकीकृत करती है। इस उन्नत तर्क ढांचे का उपयोग करके, AR1 पारंपरिक एंड-टू-एंड इमिटेशन लर्निंग मॉडलों की ज्ञात कमजोरियों का मुकाबला करता है। ये मॉडल विशेष रूप से अप्रत्याशित और सुरक्षा-महत्वपूर्ण ड्राइविंग स्थितियों में अक्सर विफल हो जाते हैं, जहाँ कारण की समझ सीमित होती है।

AR1 केवल तत्काल उत्तेजनाओं पर प्रतिक्रिया करने के बजाय, जटिल परिस्थितियों का मूल्यांकन करता है और सड़क पर मौजूद अन्य उपयोगकर्ताओं की गतिविधियों का पूर्वानुमान लगाता है। यह व्यवस्थित तर्क दृष्टिकोण चुनौतीपूर्ण सिमुलेशन में केवल प्रक्षेप पथ पर आधारित मॉडलों की तुलना में योजना सटीकता में उल्लेखनीय सुधार प्रदर्शित करता है। साथ ही, वाहन पर किए गए सड़क परीक्षणों में इसने कम विलंबता (Low Latency) के साथ वास्तविक समय का प्रदर्शन भी सफलतापूर्वक दिखाया है। यह दर्शाता है कि यह मॉडल न केवल सोचने में बेहतर है, बल्कि क्रियान्वित करने में भी तीव्र है।

इस आर्किटेक्चर के व्यापक विकास और अपनाने को प्रोत्साहित करने के लिए, एनवीडिया ने साथ ही साथ गिटहब (GitHub) पर 'कॉसमॉस कुकबुक' (Cosmos Cookbook) भी जारी की है। यह व्यापक संसाधन पैकेज आवश्यक गाइड, उपकरण और कार्यप्रवाह प्रदान करता है। इसका उद्देश्य डेवलपर्स को रोबोटिक्स और स्वायत्त प्रणालियों सहित विभिन्न अनुप्रयोगों में मूलभूत कॉसमॉस प्लेटफॉर्म को तैनात करने और फाइन-ट्यून करने में सहायता करना है। मॉडल के वेट्स और उपकरणों की यह रणनीतिक रिलीज़ एनवीडिया को एक मूलभूत प्रौद्योगिकी प्रदाता के रूप में स्थापित करती है। यह कंपनी की उस महत्वाकांक्षा को मजबूत करता है कि उसका हार्डवेयर और सॉफ्टवेयर मशीन इंटरैक्शन के अगले क्रांतिकारी चरण की आधारशिला बने।

संक्षेप में कहें तो, अल्पामयो-आर1 का आगमन एआई के क्षेत्र में एक महत्वपूर्ण मोड़ है। यह मशीन लर्निंग को केवल डेटा प्रोसेसिंग से निकालकर भौतिक दुनिया की जटिलताओं को समझने और उनमें सुरक्षित रूप से हस्तक्षेप करने की दिशा में ले जाता है। यह कदम स्वायत्त वाहनों के भविष्य को आकार देने में एनवीडिया की अग्रणी भूमिका को और पुष्ट करता है, जहाँ निर्णय लेने की प्रक्रिया अब केवल प्रोग्रामिंग पर नहीं, बल्कि समझ पर आधारित होगी।

स्रोतों

  • Punto Informatico

  • Nvidia Releases New AI Model Alpamayo-R1, Advancing Autonomous Driving Research

  • Nvidia Drops Alpamayo R1 As Open Source Leap Toward Level 4 Autonomy

  • NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025 | AIM

  • Nvidia lancia modello AI per la guida autonoma Alpamayo-R1

  • NVIDIA debuts Cosmos Reason AI model to advance physical AI and robotics

क्या आपने कोई गलती या अशुद्धि पाई?

हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।

एनवीडिया ने 'फिजिकल एआई' के लिए ओपन वीएलए ... | Gaya One