गूगल डीपमाइंड ने पेश किया Veo 3.1: प्रोफेशनल कंट्रोल्स और नेटिव वर्टिकल वीडियो के साथ नया अपडेट

द्वारा संपादित: Veronika Radoslavskaya

13 जनवरी, 2026 को गूगल डीपमाइंड ने अपने सबसे उन्नत वीडियो जनरेशन मॉडल, Veo 3.1 के लिए एक व्यापक और क्रांतिकारी फीचर अपडेट की घोषणा की है। इस नए अपडेट का मुख्य केंद्र "इंग्रीडिएंट्स टू वीडियो" (Ingredients to Video) टूलसेट है, जिसे विशेष रूप से उन क्रिएटर्स के लिए डिज़ाइन किया गया है जिन्हें अपनी रचनात्मक दृष्टि को हकीकत में बदलने के लिए पेशेवर स्तर की सटीकता और नियंत्रण की आवश्यकता होती है। यह टूलसेट संदर्भ छवियों (reference images) को उच्च-गुणवत्ता वाली सिनेमाई गति में बदलने की प्रक्रिया को पहले से कहीं अधिक सरल और प्रभावी बनाता है, जिससे एआई-आधारित फिल्म निर्माण में एक नया अध्याय जुड़ गया है।

आज के डिजिटल परिदृश्य में, जहाँ मोबाइल उपकरणों का उपयोग और शॉर्ट-फॉर्म वीडियो का चलन चरम पर है, Veo 3.1 ने नेटिव 9:16 वर्टिकल सपोर्ट पेश करके एक बड़ा रणनीतिक कदम उठाया है। यह सुविधा क्रिएटर्स को सीधे यूट्यूब शॉर्ट्स (YouTube Shorts) जैसे प्लेटफॉर्म के लिए उच्च-गुणवत्ता वाला फुल-स्क्रीन कंटेंट तैयार करने में सक्षम बनाती है। इससे पहले, फिल्म निर्माताओं को हॉरिजॉन्टल वीडियो को वर्टिकल फॉर्मेट में बदलने के लिए क्रॉपिंग का सहारा लेना पड़ता था, जिससे अक्सर वीडियो की गुणवत्ता और रेजोल्यूशन में भारी गिरावट आती थी। अब, इस नए अपडेट के साथ, क्रिएटर्स बिना किसी तकनीकी समझौते के बेहतरीन विजुअल परिणाम प्राप्त कर सकते हैं।

पेशेवर उत्पादन की कठोर मांगों और बड़े पर्दे की जरूरतों को पूरा करने के लिए, गूगल ने इस मॉडल में उन्नत 4K अपस्केलिंग तकनीक को भी एकीकृत किया है। यह फीचर वीडियो के हर फ्रेम में असाधारण गहराई और स्पष्टता जोड़ता है, जिससे सूक्ष्म टेक्सचर और बारीक विवरण सजीव हो उठते हैं। एआई द्वारा निर्मित ये क्लिप्स अब न केवल स्मार्टफोन स्क्रीन के लिए बल्कि बड़े सिनेमाई डिस्प्ले और उच्च-स्तरीय फिल्म निर्माण वर्कफ़्लो के लिए भी पूरी तरह से उपयुक्त हैं। यह सुधार फिल्म निर्माताओं को अपनी परियोजनाओं में एआई-जनरेटेड दृश्यों को निर्बाध रूप से शामिल करने का लचीलापन प्रदान करता है।

इस अपडेट की सबसे महत्वपूर्ण विशेषता इसका उन्नत "इंग्रीडिएंट्स" सिस्टम है, जो पात्रों की पहचान और दृश्य शैली की निरंतरता (consistency) बनाए रखने के क्षेत्र में एक बड़ी सफलता है। "इंग्रीडिएंट्स टू वीडियो" फ्रेमवर्क के माध्यम से, गूगल डीपमाइंड ने एआई वीडियो निर्माण की सबसे बड़ी बाधाओं में से एक को दूर किया है। अब क्रिएटर्स अपनी कहानियों के विभिन्न दृश्यों में एक समान विजुअल टोन, लाइटिंग और कैरेक्टर डिजाइन सुनिश्चित कर सकते हैं, जिससे पूरी फिल्म में एक पेशेवर और सुसंगत प्रवाह बना रहता है।

  • ट्रिपल-इमेज रेफरेंसिंग: यह अनूठी सुविधा उपयोगकर्ताओं को एक ही वीडियो जनरेशन के लिए तीन अलग-अलग संदर्भ चित्र प्रदान करने की अनुमति देती है। उदाहरण के लिए, आप एक विशिष्ट पात्र, एक विस्तृत वातावरण और एक विशेष कलात्मक शैली का चयन कर सकते हैं। एआई इन तीनों इनपुट्स को कुशलतापूर्वक मिलाकर एक ऐसा वीडियो तैयार करता है जो पात्र की बनावट और माहौल की अखंडता को पूरी तरह सुरक्षित रखता है।
  • फर्स्ट और लास्ट फ्रेम कंट्रोल: यह एक अत्यंत शक्तिशाली क्षमता है जो फिल्म निर्माताओं को वीडियो के सटीक शुरुआती और अंतिम दृश्यों को परिभाषित करने का पूर्ण अधिकार देती है। Veo 3.1 इन दोनों छवियों के बीच एक सहज, तार्किक और सिनेमाई ट्रांजिशन विकसित करता है, जिससे कहानी का विजुअल लॉजिक और प्रवाह प्राकृतिक बना रहता है।
  • सीन एक्सटेंशन: लंबी और जटिल कहानियों को प्रभावी ढंग से प्रस्तुत करने के लिए, यह मॉडल अब पिछले क्लिप के अंतिम फ्रेम का विश्लेषण करके नए वीडियो सेगमेंट बना सकता है। यह तकनीक सुनिश्चित करती है कि वीडियो की गति, लाइटिंग और विजुअल एलिमेंट्स में कोई रुकावट न आए और कहानी बिना किसी विजुअल जर्क के निरंतर आगे बढ़ती रहे।

तकनीकी सुधारों के साथ-साथ, Veo 3.1 अब पेशेवर सिनेमैटोग्राफी के जटिल निर्देशों को भी बेहतर तरीके से समझने और लागू करने में सक्षम है। "डॉली-इन", "पैन" और "सिनेमैटिक लाइटिंग" जैसे कैमरा मूवमेंट्स को अब एआई अद्भुत सटीकता के साथ निष्पादित करता है। इसके अलावा, वीडियो के साथ सिंक्रोनाइज़्ड ऑडियो का समावेश इस अनुभव को और भी प्रभावशाली बनाता है। इसमें परिवेश की ध्वनियाँ (ambient sounds), विशेष ध्वनि प्रभाव (SFX) और पात्रों के लिए प्रयोगात्मक लिप-सिंकिंग तकनीक शामिल है, जो दर्शकों के लिए एक संपूर्ण, तल्लीन कर देने वाला और वास्तविक अनुभव सुनिश्चित करती है।

उपलब्धता के मोर्चे पर, गूगल इन नई क्षमताओं को अपने पूरे पारिस्थितिकी तंत्र में तेजी से एकीकृत कर रहा है ताकि हर स्तर के क्रिएटर्स इसका लाभ उठा सकें। Veo 3.1 के ये फीचर्स अब जेमिनी (Gemini) ऐप और फिल्म निर्माण के लिए समर्पित प्लेटफॉर्म 'फ्लो' (Flow) पर उपलब्ध कराए गए हैं। इसके अतिरिक्त, एंटरप्राइज स्तर के उपयोगकर्ताओं और बड़े स्टूडियो के लिए, ये सुविधाएँ जेमिनी एपीआई (Gemini API) और वर्टेक्स एआई (Vertex AI) के माध्यम से सुलभ हैं, जिससे पेशेवर फिल्म निर्माण में एआई के उपयोग की नई संभावनाएं खुल गई हैं।

सुरक्षा और एथिकल एआई के प्रति अपनी अटूट प्रतिबद्धता को दोहराते हुए, गूगल ने Veo 3.1 द्वारा निर्मित हर वीडियो में 'सिंथआईडी' (SynthID) डिजिटल वॉटरमार्किंग तकनीक को अनिवार्य रूप से शामिल किया है। यह अदृश्य वॉटरमार्क सामग्री की पारदर्शिता और उसकी उत्पत्ति की पहचान सुनिश्चित करता है। उपयोगकर्ताओं के पास अब यह विकल्प भी है कि वे किसी भी संदिग्ध वीडियो को जेमिनी ऐप पर अपलोड करके उसकी प्रामाणिकता की जांच कर सकें। यह सत्यापन प्रक्रिया यह स्पष्ट करती है कि वीडियो गूगल के एआई उपकरणों द्वारा बनाया गया है या नहीं, जो आज के डिजिटल युग में गलत सूचनाओं के प्रसार को रोकने और सामग्री की विश्वसनीयता बनाए रखने के लिए अत्यंत आवश्यक है।

50 दृश्य

स्रोतों

  • Digital Trends Español

  • Techmeme

  • Veo 3.1 Ingredients to Video: More consistency, creativity and control

  • Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com

  • Google DeepMind

  • The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge

क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।