क्वाईशू ने क्लिंग एआई 3.0 का अनावरण किया: एकीकृत मल्टीमॉडल आर्किटेक्चर और नेटिव ऑडियो के साथ नई क्रांति

द्वारा संपादित: Veronika Radoslavskaya

5 फरवरी, 2026 को, क्वाईशू टेक्नोलॉजी (Kuaishou Technology) ने आधिकारिक तौर पर अपने क्लिंग 3.0 (Kling 3.0) मॉडल परिवार को पेश करके कृत्रिम बुद्धिमत्ता के क्षेत्र में एक नया मील का पत्थर स्थापित किया है। इस नई श्रृंखला में वीडियो 3.0, वीडियो 3.0 ओम्नी, इमेज 3.0 और इमेज 3.0 ओम्नी जैसे शक्तिशाली मॉडल शामिल हैं। यह रिलीज एआई वीडियो निर्माण के क्षेत्र में एक मौलिक बदलाव का संकेत देती है, जो अब केवल अलग-थलग क्लिप बनाने के बजाय जटिल और कहानी-आधारित दृश्यों के निर्देशन के लिए एक व्यापक टूलसेट प्रदान करती है।

क्लिंग 3.0 अपनी 'नेटिव ऑडियो' (Native Audio) क्षमताओं के साथ एआई वीडियो को एक नए स्तर पर ले जाता है, जिससे मूक वीडियो का दौर समाप्त हो रहा है। अब एआई द्वारा निर्मित वीडियो केवल दृश्य लूप नहीं रहेंगे, बल्कि पूरी तरह से इमर्सिव और जीवंत कंटेंट में बदल जाएंगे। यह तकनीक वीडियो निर्माण की प्रक्रिया को और अधिक वास्तविक, प्रभावशाली और पेशेवर बनाने के लिए विशेष रूप से डिज़ाइन की गई है।

  • बहुभाषी संवाद क्षमता: यह मॉडल वैश्विक संचार की बाधाओं को तोड़ते हुए अंग्रेजी, चीनी, जापानी, कोरियाई और स्पेनिश जैसी प्रमुख भाषाओं में उच्च गुणवत्ता वाला भाषण उत्पन्न करने का समर्थन करता है। इसमें विभिन्न क्षेत्रीय लहजों, जैसे कि ब्रिटिश और अमेरिकी अंग्रेजी के बीच के सूक्ष्म अंतरों को भी बहुत सटीकता और स्वाभाविकता के साथ संभाला गया है।
  • जटिल पात्र अंतःक्रियाएं: एआई की यह नई पीढ़ी अब एक ही दृश्य के भीतर तीन अलग-अलग पात्रों के बीच संवाद का कुशलतापूर्वक समन्वय कर सकती है। यह सिस्टम स्वचालित रूप से वक्ताओं को ट्रैक करता है, प्रत्येक पात्र को एक विशिष्ट और अद्वितीय आवाज (वॉइस टिम्ब्रे) प्रदान करता है और होंठों के हिलने की गति (लिप-सिंक्रोनाइज़ेशन) को पूरी तरह सटीक रखता है।
  • यथार्थवादी ध्वनि प्रभाव: संवाद के अलावा, क्लिंग 3.0 'डायजेनिक साउंड' उत्पन्न करने में सक्षम है, जिसमें पैरों की आहट, वस्तुओं के टकराने की आवाज और आसपास का शोर शामिल है। इसके साथ ही, यह बैकग्राउंड स्कोर भी तैयार करता है जो दृश्य के विजुअल मूड और भावनात्मक गहराई के साथ पूरी तरह मेल खाता है।

क्लिंग 3.0 का 'इंटेलिजेंट मल्टी-शॉट' (Intelligent Multi-Shot) फीचर एआई वीडियो निर्माण की एक सबसे बड़ी चुनौती को हल करता है, जो कि कहानी का निरंतर प्रवाह सुनिश्चित करना है। अब क्रिएटर्स एक सुसंगत 15-सेकंड का वीडियो अनुक्रम तैयार कर सकते हैं जिसमें छह अलग-अलग कैमरा कट्स तक शामिल हो सकते हैं, जो पहले संभव नहीं था।

यह एआई मॉडल अब सिनेमाई भाषा और निर्देशन की बारीकियों को गहराई से समझता है। यह विभिन्न प्रकार के शॉट्स के बीच सहज और पेशेवर बदलाव की अनुमति देता है। उदाहरण के लिए, निर्देशक अब एक विस्तृत एस्टेब्लिशिंग शॉट से सीधे एक गहन क्लोज-अप पर जा सकते हैं, या वक्ताओं के बीच कैमरा एंगल बदल सकते हैं, जिसे फिल्म निर्माण की भाषा में शॉट-रिवर्स-शॉट कहा जाता है।

वीडियो 3.0 ओम्नी मॉडल की एक सबसे बड़ी ताकत इसकी विषय निरंतरता (Subject Consistency) बनाए रखने की क्षमता है। कैमरा एंगल या शॉट बदलने पर भी पात्रों और उनके आसपास के वातावरण की पहचान पूरी तरह सुरक्षित रहती है। एक ही जनरेशन के भीतर कैमरा एंगल बदलने पर पात्र अपनी परिभाषित विशेषताओं को नहीं खोते हैं और न ही उनमें कोई अवांछित बदलाव आता है।

विजुअल क्वालिटी और इमेज 3.0 ओम्नी के माध्यम से दृश्य क्षमताओं को पेशेवर फिल्म निर्माण के मानकों तक पहुँचाया गया है। यह मॉडल विशेष रूप से उच्च-स्तरीय स्थिर दृश्यों के लिए तैयार किया गया है, जो 2K और 4K आउटपुट का समर्थन करता है। यह जटिल लाइटिंग सेटअप, छाया के खेल और यथार्थवादी बनावट (textures) को संभालने में उत्कृष्ट प्रदर्शन करता है।

एआई मॉडल अब छवियों और वीडियो के भीतर स्पष्ट और पठनीय टेक्स्ट दिखाने में महत्वपूर्ण सुधार प्रदर्शित कर रहे हैं। चाहे वह सड़क के किनारे लगे साइनबोर्ड हों, कपड़ों पर छपे हुए लोगो हों या किसी इलेक्ट्रॉनिक डिवाइस की स्क्रीन पर दिखने वाला डेटा, क्लिंग 3.0 इन विवरणों को स्पष्टता से प्रस्तुत करता है, जो पारंपरिक रूप से जनरेटिव मॉडल के लिए एक बड़ी विफलता का बिंदु रहा है।

वीडियो 3.0 मॉडल नेटिव 1080p आउटपुट प्रदान करता है जिसमें उच्च फ्रेम रेट की स्थिरता सुनिश्चित की गई है। यह तकनीक यह सुनिश्चित करती है कि अत्यधिक गतिशील एक्शन दृश्यों में भी गति बिल्कुल सहज, तरल और प्राकृतिक बनी रहे। इससे दर्शकों को बिना किसी रुकावट के एक उच्च गुणवत्ता वाला सिनेमाई अनुभव प्राप्त होता है जो पेशेवर कैमरों से लिए गए फुटेज जैसा महसूस होता है।

उपलब्धता के संदर्भ में, क्लिंग 3.0 वर्तमान में क्लिंग एआई वेब इंटरफेस के माध्यम से विशेष अर्ली एक्सेस चरणों में उपलब्ध कराया गया है। डेवलपर्स और बड़े उद्यमों के लिए जो इसे अपने सिस्टम में एकीकृत करना चाहते हैं, ये मॉडल तीसरे पक्ष के प्रदाता 'फाल एआई' (Fal AI) के माध्यम से एपीआई द्वारा सुलभ हैं। यह नवाचार डिजिटल कंटेंट क्रिएशन और फिल्म निर्माण के भविष्य को एक नई दिशा देने के लिए तैयार है।

12 दृश्य

स्रोतों

  • TechBullion

  • PRNewswire

  • AI NEWS

  • NDTV

  • YouTube

  • Focal

क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।