कुआइशू का 'क्लिंग वीडियो O1' लॉन्च: वीडियो निर्माण और संपादन के लिए दुनिया का पहला एकीकृत मॉडल
द्वारा संपादित: Veronika Radoslavskaya
कृत्रिम बुद्धिमत्ता (एआई) वीडियो के क्षेत्र में एक बड़ा बदलाव देखने को मिला है, जिसकी वजह क्लिंग वीडियो O1 (ओमनी वन) नामक एक शक्तिशाली नए फाउंडेशन मॉडल का आगमन है। इस मॉडल को दुनिया का पहला एकीकृत मल्टीमॉडल इंजन माना जा रहा है, जो वीडियो निर्माण और उन्नत संपादन दोनों कार्यों को एक साथ संभालता है। कुआइशू (Kuaishou) द्वारा विकसित इस मॉडल ने रचनात्मक कार्यप्रवाह में मौजूद अलगाव को समाप्त कर दिया है। अब रचनाकारों को निर्माण, संपादन और सुधार के लिए अलग-अलग उपकरणों के बीच भटकने की आवश्यकता नहीं रहेगी।
तकनीकी सफलता का मुख्य केंद्र O1 की वह क्षमता है जिसके तहत यह एक ही सहज कार्यप्रवाह में विभिन्न प्रकार के इनपुट स्वीकार करता है। इसमें टेक्स्ट प्रॉम्प्ट, सात तक की संदर्भ छवियां, और वीडियो क्लिप शामिल हैं। यह एकीकृत मल्टीमॉडल इंजन रचनाकारों को उच्च-निष्ठा वाले 1080p दृश्य उत्पन्न करने की सुविधा देता है, और तुरंत बाद ही केवल प्राकृतिक भाषा के आदेशों का उपयोग करके पोस्ट-प्रोडक्शन संपादन लागू करने की अनुमति देता है। उपयोगकर्ता अब सीधे निर्देश दे सकते हैं, जैसे कि 'पृष्ठभूमि से राहगीर को हटा दो,' 'दिन के समय को गोधूलि में बदलो,' या 'मुख्य पात्र की पोशाक बदल दो।' मॉडल इन निर्देशों को सटीक रूप से समझता है और दृश्य संदर्भ के आधार पर आवश्यक बदलावों को कार्यान्वित करता है। यह सुविधा संपादन प्रक्रिया को अत्यंत सरल बनाती है।
क्लिंग वीडियो O1 उद्योग की पुरानी चुनौतियों का समाधान करता है, विशेष रूप से दृश्य संगति (विज़ुअल कोहेरेंस) के मामले में। इसे लंबी दृश्यावलियों और जटिल कैमरा गतिविधियों के दौरान असाधारण चरित्र संगति और शैली बनाए रखने के लिए डिज़ाइन किया गया है। यह एक मानव निर्देशक की तरह काम करता है, जो दृश्य 'भटकाव' या झिलमिलाहट वाले कलाकृतियों को रोकता है। इसके अतिरिक्त, यह मॉडल स्टार्ट और एंड फ्रेम नियंत्रण जैसी सुविधाओं के माध्यम से सूक्ष्म नियंत्रण प्रदान करता है। यह संपादकों को यह परिभाषित करने की अनुमति देता है कि कोई शॉट ठीक कहाँ से शुरू और समाप्त हो, जिससे स्थिर छवियों के सटीक एनिमेशन और सहज संक्रमण संभव हो पाते हैं। हालांकि आधार क्लिप आमतौर पर 5 से 10 सेकंड के होते हैं, O1 की वास्तुकला दो मिनट तक की लंबी, अधिक सुसंगत कथात्मक क्लिप उत्पन्न करने का समर्थन करती है, जो इसकी क्षमता को दर्शाता है।
तकनीकी मोर्चे पर, इस मॉडल में बेहतर प्रॉम्प्ट विश्लेषण और भौतिकी समझ के लिए एक चेन-ऑफ-थॉट (CoT) तर्क प्रणाली शामिल है। बेंचमार्क परिणामों से पता चलता है कि यह जटिल परिवर्तन कार्यों में गूगल वेओ 3.1 (Google Veo 3.1) और रनवे एलेफ (Runway Aleph) जैसे प्रतिस्पर्धियों पर महत्वपूर्ण प्रदर्शन बढ़त रखता है। टेक्स्ट-टू-वीडियो से लेकर दृश्य विस्तार और संपादन तक, इन सात प्रमुख रचनात्मक क्षमताओं को मिलाकर, क्लिंग वीडियो O1 पेशेवर दक्षता के लिए एक नया मानक स्थापित करता है। यह सुनिश्चित करता है कि अवधारणा से लेकर अंतिम कट तक उच्च गुणवत्ता और निरंतरता बनी रहे।
13 दृश्य
स्रोतों
מגזין גאדג'טים וטכנולוגיה - Gadgety.co.il | גאדג'טי
Kling's Video O1 launches as the first all-in-one video model for generation and editing
Kling AI Launches O1, the Industry's First Unified Multimodal Video Model, Revolutionizing Content Creation and Editing - Barchart.com
Kling AI releases unified video model - Kr Asia
'Nano Banana' of AI Video: Chinese platform Kling AI Launches O1 AI Video Editing Model
Creativity AI #52: Runway claims the top spot, Kling goes multimodal, and Midjourney rethinks its UI - Medium
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
