रनवे जेन-4.5 ने वीडियो एआई बेंचमार्क में उद्योग दिग्गजों को पछाड़कर शीर्ष स्थान हासिल किया

द्वारा संपादित: Veronika Radoslavskaya

स्वतंत्र एआई स्टार्टअप में अग्रणी, रनवे ने अपना नवीनतम टेक्स्ट-टू-वीडियो मॉडल, रनवे जेन-4.5 जारी किया है, जिसने तुरंत प्रतिस्पर्धी माहौल में हलचल मचा दी है। यह नया मॉडल वर्तमान में आधिकारिक आर्टिफिशियल एनालिसिस टेक्स्ट-टू-वीडियो बेंचमार्क में 1247 के एलो स्कोर के साथ शीर्ष पर है। यह स्कोर इसे गूगल के वियो 3 (Veo 3) और ओपनएआई के सोरा 2 प्रो (Sora 2 Pro) से थोड़ा आगे रखता है। यह सफलता एनवीडिया (Nvidia) के साथ मिलकर अनुकूलित हार्डवेयर पर बनाए गए उत्तरदायी, नियंत्रणीय और एकीकृत वर्कफ़्लो उपकरणों पर रनवे के ध्यान की मजबूती को दर्शाती है।

जेन-4.5 को इसके पिछले संस्करण की तुलना में काफी अधिक दृश्य रूप से सुसंगत और उपयोगकर्ता के निर्देशों के प्रति अधिक उत्तरदायी बताया गया है। यह मॉडल सामग्री निर्माताओं और उद्यमों के लिए रचनात्मक संभावनाओं को बढ़ावा देने के उद्देश्य से सिनेमाई-गुणवत्ता वाले आउटपुट प्रदान करता है। रनवे की पारंपरिक शक्ति उसके व्यापक, ब्राउज़र-आधारित पारिस्थितिकी तंत्र में निहित है। यह पारिस्थितिकी तंत्र उपयोगकर्ताओं को तेजी से पुनरावृति करने, कैमरा गतिविधियों पर रचनात्मक नियंत्रण रखने और मौजूदा पेशेवर संपादन उपकरणों के साथ सहज एकीकरण की अनुमति देता है। यही कारण है कि यह उन एकल रचनाकारों और सामग्री एजेंसियों के बीच पसंदीदा है जो जटिल बुनियादी ढांचे के बजाय फुर्तीले वर्कफ़्लो को प्राथमिकता देते हैं।

हालांकि, इन तकनीकी सफलताओं के बावजूद, उद्योग के लिए कुछ परिचित चुनौतियां बनी हुई हैं। रनवे ने स्वीकार किया है कि जेन-4.5 अभी भी उन मूलभूत कमजोरियों से जूझ रहा है जो वर्तमान में सभी वीडियो मॉडलों को प्रभावित करती हैं। इनमें कारणता (Causality) शामिल है, जहां सिस्टम भौतिक घटनाओं को सटीक रूप से मॉडल करने में विफल रहता है, जैसे कि हैंडल दबाने के बाद ही दरवाज़ा खुलना। इसके अतिरिक्त, वस्तु स्थायित्व (Object Permanence) की समस्या भी मौजूद है, जिसके कारण वस्तुएं कभी-कभी अस्पष्ट होने पर क्षण भर के लिए गायब हो जाती हैं।

यह मॉडल एक 'सफलता पूर्वाग्रह' (Success Bias) भी प्रदर्शित करता है, जो यथार्थवादी रूप से होने वाली घटनाओं की तुलना में सफल कार्यों का अधिक बार अनुकरण करता है। ये लगातार बनी रहने वाली समस्याएं इस बात को उजागर करती हैं कि उद्योग अभी तक ऐसे विश्वसनीय 'विश्व मॉडल' हासिल नहीं कर पाया है जो वास्तविक दुनिया के भौतिकी का सटीक अनुकरण कर सकें। यह एक ऐसा क्षेत्र है जिस पर रनवे भविष्य में विकास जारी रखने की योजना बना रहा है।

इस बीच, विशिष्ट क्षेत्रों में प्रतिस्पर्धा कड़ी बनी हुई है। गूगल का वियो 3 जैसे प्रतिद्वंद्वी समर्पित 4के फोटोरीयलिज्म और एकीकृत मूल ऑडियो में बढ़त बनाए रखते हैं, जबकि सोरा 2 प्रो जटिल भौतिक सिमुलेशन और बहु-शॉट निरंतरता पर अधिक ध्यान केंद्रित करता है। जेन-4.5 को धीरे-धीरे पेश किया जा रहा है और आने वाले दिनों में यह रनवे के सभी उपयोगकर्ताओं के लिए उपलब्ध हो जाएगा, जिससे एकीकृत रचनात्मक उपकरणों के लिए बेंचमार्क लीडर के रूप में रनवे की स्थिति मजबूत होगी। यह कदम स्पष्ट रूप से दर्शाता है कि एआई वीडियो निर्माण के क्षेत्र में प्रतिस्पर्धा का माहौल गर्म है, और रनवे ने फिलहाल बाजी मार ली है।

स्रोतों

  • WinBuzzer

  • Seeking Alpha

  • alphaXiv

क्या आपने कोई गलती या अशुद्धि पाई?

हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।