Google का Gemini 2.5 Flash Image लॉन्च: AI इमेज जनरेशन में एक नया कदम
द्वारा संपादित: gaya ❤️ one
नई दिल्ली: 2 अक्टूबर 2025 को, Google ने Gemini 2.5 Flash Image को लॉन्च किया है, जो AI-संचालित इमेज जनरेशन और एडिटिंग के क्षेत्र में एक महत्वपूर्ण प्रगति है। यह उन्नत मॉडल अब डेवलपर्स और उद्यमों के लिए सामान्य रूप से उपलब्ध है, जो Gemini API, Google AI Studio और Vertex AI के माध्यम से सुलभ है। इस लॉन्च के साथ, Google ने AI इमेजिंग की दुनिया में अपनी स्थिति को और मजबूत किया है, जो बाज़ार में बढ़ती प्रतिस्पर्धा के बीच एक रणनीतिक कदम है।
Gemini 2.5 Flash Image की सबसे खासियतों में से एक है इसकी 10 विभिन्न आस्पेक्ट रेशियो के लिए सपोर्ट, जो इसे सिनेमाई लैंडस्केप से लेकर वर्टिकल सोशल मीडिया फॉर्मेट तक, विभिन्न प्लेटफार्मों के लिए उपयुक्त बनाता है। एक और महत्वपूर्ण सुधार कैरेक्टर कंसिस्टेंसी में है, जो प्रमुख एडिट्स के दौरान भी चेहरे की समानता को बनाए रखता है। यह AI इमेज मॉडल के लिए एक आम चुनौती का समाधान करता है। मॉडल में नेटिव मल्टीमॉडल क्षमताएं भी हैं, जो इसे टेक्स्ट और इमेज को एक साथ प्रोसेस करने की अनुमति देती हैं, जिससे अधिक सटीक और सुसंगत एडिट्स संभव होते हैं।
इस नए मॉडल की कीमत $0.039 प्रति इमेज और 30 डॉलर प्रति मिलियन आउटपुट टोकन रखी गई है, जिसका उद्देश्य Vertex AI के माध्यम से एंटरप्राइज एडॉप्शन को बढ़ावा देना है। शुरुआती अपनाने वालों ने इसकी अनूठी क्षमताओं की प्रशंसा की है। AI स्टार्टअप Cartwheel के सह-संस्थापक Andrew Carr ने उल्लेख किया कि मॉडल जटिल पोज़ को किसी भी कैमरा एंगल से संभालने में माहिर है, और यह अन्य मॉडलों की तुलना में 'वर्ल्ड नॉलेज' भी प्रदान करता है।
Gemini 2.5 Flash Image का लॉन्च OpenAI के GPT-4o इमेज जनरेटर को ChatGPT में एकीकृत करने की प्रतिक्रिया के रूप में देखा जा रहा है, जो बाज़ार में प्रतिस्पर्धा को और बढ़ा रहा है। Google का लक्ष्य सीधे अपने चैट ऐप के भीतर व्यापक दर्शकों को लक्षित करके बड़े पैमाने पर अपनाना है। डीपफेक से निपटने के लिए, Google सभी जनरेटेड कंटेंट पर स्पष्ट और अदृश्य SynthID वॉटरमार्क लागू कर रहा है, जो AI उत्पत्ति को स्पष्ट रूप से इंगित करता है। यह तकनीक Google DeepMind द्वारा विकसित की गई है, यह Midjourney जैसे प्रतिस्पर्धियों के विपरीत है, जो डिज्नी और यूनिवर्सल से कॉपीराइट उल्लंघन के मुकदमे का सामना कर रहा है।
कॉपीराइट कानून के संबंध में, यह ध्यान रखना महत्वपूर्ण है कि वर्तमान में, संयुक्त राज्य अमेरिका में AI-जनित कार्यों को कॉपीराइट सुरक्षा के लिए पात्र नहीं माना जाता है, क्योंकि कॉपीराइट के लिए मानव लेखकत्व की आवश्यकता होती है। हालांकि, AI मॉडल को प्रशिक्षित करने के लिए कॉपीराइट डेटा का उपयोग एक कानूनी ग्रे क्षेत्र बना हुआ है, जिसमें कई मुकदमे चल रहे हैं। Gemini 2.5 Flash Image को एकीकृत करके, Google AI को एक व्यापक रचनात्मक इंजन के रूप में स्थापित कर रहा है। यह कदम तेजी से विकसित हो रहे जनरेटिव AI क्षेत्र में मुख्यधारा के उपयोगकर्ताओं को आकर्षित करने के लिए पहुंच और विश्वास पर एक दांव का प्रतिनिधित्व करता है। यह तकनीक न केवल रचनाकारों के लिए नए रास्ते खोलती है, बल्कि यह भी सुनिश्चित करती है कि डिजिटल दुनिया में पारदर्शिता और प्रामाणिकता बनी रहे।
स्रोतों
WinBuzzer
Gemini Flash - Google DeepMind
Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI
Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind
Release notes | Gemini API | Google AI for Developers
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।
