गूगल ने नेक्स्ट-जेन फ्लो टूलिंग और बेहतर ऑडियो के साथ Veo 3.1 AI वीडियो मॉडल लॉन्च किया
द्वारा संपादित: Veronika Radoslavskaya
डिजिटल सामग्री निर्माण के क्षेत्र में एक महत्वपूर्ण परिवर्तन आया है। Google ने अपने नवीनतम कृत्रिम बुद्धिमत्ता वीडियो जनरेशन मॉडल, Veo 3.1, को अपनी एकीकृत फ्लो फिल्म निर्माण सूट में बड़े संवर्द्धन के साथ पेश किया है। यह विकास रचनात्मक उपकरणों का एक बड़ा पुनर्समायोजन है, जो दृश्य कहानीकारों को पहले से कहीं अधिक सटीकता और नियंत्रण के साथ जटिल अवधारणाओं को साकार करने का साधन प्रदान करता है। इस घोषणा का मूल उद्देश्य एआई ढांचे के भीतर बेहतर यथार्थवाद, परिष्कृत सिंक्रनाइज़्ड ऑडियो क्षमताओं और कथा संरचना की गहरी, अधिक सहज समझ प्रदान करने पर केंद्रित है।
Veo 3.1, जो मई 2025 में प्रस्तुत किए गए आरंभिक Veo 3 मॉडल की नींव पर आधारित है, बेहतर बनावट प्रतिपादन और सूक्ष्म पर्यावरणीय प्रकाश व्यवस्था के माध्यम से दृश्य आउटपुट को परिष्कृत करता है। यह तकनीक अब फोटोरियलिज्म के और करीब पहुंच गई है। सबसे महत्वपूर्ण बात यह है कि यह मॉडल अब उन्नत ऑडियो जनरेशन में उत्कृष्ट है, यह सुनिश्चित करता है कि ध्वनि प्रभाव और संवाद दृश्य क्रिया के साथ जटिल रूप से सिंक्रनाइज़ हों। यह विशेषता शुरुआती जनरेटिव प्रणालियों में विसर्जन को तोड़ने वाली एक सामान्य समस्या को सफलतापूर्वक दूर करती है। एआई अब सिनेमाई भाषा की गहरी समझ भी प्रदर्शित करता है, जिससे यह विशिष्ट शैलीगत संकेतों का अधिक बारीकी से पालन कर सकता है। उपयोगकर्ताओं के लिए Veo 3.1 फास्ट मॉडल भी उपलब्ध कराया गया है।
यह बढ़ी हुई जनरेटिव शक्ति सीधे अद्यतन फ्लो फिल्म निर्माण उपकरण के माध्यम से प्रसारित की जाती है, जिसने अपनी शुरुआत के बाद से 275 मिलियन से अधिक वीडियो उत्पन्न किए हैं। रचनाकारों को अब जटिल उत्पादन कार्यों को सुव्यवस्थित करने के लिए डिज़ाइन किए गए शक्तिशाली नए कार्यों का एक सेट मिलता है। 'इंग्रीडिएंट्स टू वीडियो' नामक सुविधा उपयोगकर्ताओं को कई संदर्भ चित्र इनपुट करने की अनुमति देती है, जिससे एक क्रम में लगातार चरित्र डिजाइन और दृश्य सौंदर्य स्थापित होता है, और अब इसमें मिलान वाला ऑडियो भी शामिल है। महत्वाकांक्षी कथाओं के लिए, 'सीन एक्सटेंशन' सुविधा ऑडियो निरंतरता बनाए रखते हुए, उत्पन्न क्लिप को लंबा करने की अनुमति देती है, जिससे पिछली लघु-रूप बाधाएं कम होती हैं।
फ्लो टूल नियंत्रण के अभिनव रूप भी प्रस्तुत करता है, जैसे 'फ्रेम्स टू वीडियो'। यह सुविधा सिंक्रनाइज़्ड ऑडियो के साथ, उपयोगकर्ता द्वारा परिभाषित दो स्थिर छवियों के बीच सहज गति उत्पन्न करती है। इसके अलावा, ऑब्जेक्ट हेरफेर उपकरण दृश्य के भीतर तत्वों को डालने या हटाने में सक्षम बनाते हैं, जिसमें सिस्टम बुद्धिमानी से पुनर्गणना करता है और यथार्थवादी छाया और प्रकाश व्यवस्था लागू करता है। ऑब्जेक्ट डालने और हटाने सहित ये क्षमताएं, जेमिनी एपीआई और वर्टेक्स एआई प्लेटफॉर्म के माध्यम से तकनीक तक पहुंचने वाले डेवलपर्स और एंटरप्राइज उपयोगकर्ताओं के साथ-साथ व्यक्तिगत रचनाकारों के लिए रचनात्मक कार्यप्रवाह को फिर से परिभाषित करने के लिए तैयार हैं।
यह तकनीकी छलांग दूरदर्शी लोगों के हाथों में सीधे परिष्कृत नियंत्रण रखकर, उच्च-निष्ठा, एआई-सहायता प्राप्त वीडियो उत्पादन के लोकतंत्रीकरण के प्रति Google की प्रतिबद्धता को रेखांकित करती है। जटिल दृश्य निरंतरता समस्याओं को हल करने पर ध्यान केंद्रित करना, जैसे कि ऑब्जेक्ट डालने के दौरान लगातार प्रकाश व्यवस्था बनाए रखना, उन सूक्ष्म तत्वों की समझ को दर्शाता है जो सिमुलेशन को सम्मोहक कला तक बढ़ाते हैं। उद्योग विश्लेषण ने इस बात पर प्रकाश डाला है कि उच्च अस्थायी स्थिरता प्राप्त करने वाले मॉडल पेशेवर स्टूडियो के बीच प्रीमियम अपनाने की दर को नियंत्रित कर रहे हैं। यह Veo 3.1 के ऑब्जेक्ट दृढ़ता और दृश्य विस्तार पर जोर को पेशेवर रचनात्मक समुदाय के लिए अत्यधिक प्रासंगिक बनाता है, जिससे यह स्पष्ट होता है कि यह मॉडल बाजार की जरूरतों को पूरा करने के लिए बनाया गया है।
स्रोतों
Beebom
9to5Google
Google Developers Blog
TechCrunch
BGR
Google Cloud Blog
इस विषय पर और अधिक समाचार पढ़ें:
जेमिनी में सिंथआईडी और सी2पीए का गूगल का एकीकरण: एआई स्रोत सत्यापन को आम लोगों तक पहुंचाना
अलीबाबा ने क्वार्क एआई ग्लासेज के साथ स्मार्ट ग्लास की दौड़ में प्रवेश किया, जो पूरे दिन की बैटरी लाइफ पर ज़ोर देता है
पर्प्लेक्सिटी ने एआई सहायकों के लिए मेमोरी की शुरुआत की, मॉडलों में व्यक्तिगत संदर्भ को बढ़ावा दिया
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
