नई दिल्ली: 2 अक्टूबर 2025 को, Google ने Gemini 2.5 Flash Image को लॉन्च किया है, जो AI-संचालित इमेज जनरेशन और एडिटिंग के क्षेत्र में एक महत्वपूर्ण प्रगति है। यह उन्नत मॉडल अब डेवलपर्स और उद्यमों के लिए सामान्य रूप से उपलब्ध है, जो Gemini API, Google AI Studio और Vertex AI के माध्यम से सुलभ है। इस लॉन्च के साथ, Google ने AI इमेजिंग की दुनिया में अपनी स्थिति को और मजबूत किया है, जो बाज़ार में बढ़ती प्रतिस्पर्धा के बीच एक रणनीतिक कदम है।
Gemini 2.5 Flash Image की सबसे खासियतों में से एक है इसकी 10 विभिन्न आस्पेक्ट रेशियो के लिए सपोर्ट, जो इसे सिनेमाई लैंडस्केप से लेकर वर्टिकल सोशल मीडिया फॉर्मेट तक, विभिन्न प्लेटफार्मों के लिए उपयुक्त बनाता है। एक और महत्वपूर्ण सुधार कैरेक्टर कंसिस्टेंसी में है, जो प्रमुख एडिट्स के दौरान भी चेहरे की समानता को बनाए रखता है। यह AI इमेज मॉडल के लिए एक आम चुनौती का समाधान करता है। मॉडल में नेटिव मल्टीमॉडल क्षमताएं भी हैं, जो इसे टेक्स्ट और इमेज को एक साथ प्रोसेस करने की अनुमति देती हैं, जिससे अधिक सटीक और सुसंगत एडिट्स संभव होते हैं।
इस नए मॉडल की कीमत $0.039 प्रति इमेज और 30 डॉलर प्रति मिलियन आउटपुट टोकन रखी गई है, जिसका उद्देश्य Vertex AI के माध्यम से एंटरप्राइज एडॉप्शन को बढ़ावा देना है। शुरुआती अपनाने वालों ने इसकी अनूठी क्षमताओं की प्रशंसा की है। AI स्टार्टअप Cartwheel के सह-संस्थापक Andrew Carr ने उल्लेख किया कि मॉडल जटिल पोज़ को किसी भी कैमरा एंगल से संभालने में माहिर है, और यह अन्य मॉडलों की तुलना में 'वर्ल्ड नॉलेज' भी प्रदान करता है।
Gemini 2.5 Flash Image का लॉन्च OpenAI के GPT-4o इमेज जनरेटर को ChatGPT में एकीकृत करने की प्रतिक्रिया के रूप में देखा जा रहा है, जो बाज़ार में प्रतिस्पर्धा को और बढ़ा रहा है। Google का लक्ष्य सीधे अपने चैट ऐप के भीतर व्यापक दर्शकों को लक्षित करके बड़े पैमाने पर अपनाना है। डीपफेक से निपटने के लिए, Google सभी जनरेटेड कंटेंट पर स्पष्ट और अदृश्य SynthID वॉटरमार्क लागू कर रहा है, जो AI उत्पत्ति को स्पष्ट रूप से इंगित करता है। यह तकनीक Google DeepMind द्वारा विकसित की गई है, यह Midjourney जैसे प्रतिस्पर्धियों के विपरीत है, जो डिज्नी और यूनिवर्सल से कॉपीराइट उल्लंघन के मुकदमे का सामना कर रहा है।
कॉपीराइट कानून के संबंध में, यह ध्यान रखना महत्वपूर्ण है कि वर्तमान में, संयुक्त राज्य अमेरिका में AI-जनित कार्यों को कॉपीराइट सुरक्षा के लिए पात्र नहीं माना जाता है, क्योंकि कॉपीराइट के लिए मानव लेखकत्व की आवश्यकता होती है। हालांकि, AI मॉडल को प्रशिक्षित करने के लिए कॉपीराइट डेटा का उपयोग एक कानूनी ग्रे क्षेत्र बना हुआ है, जिसमें कई मुकदमे चल रहे हैं। Gemini 2.5 Flash Image को एकीकृत करके, Google AI को एक व्यापक रचनात्मक इंजन के रूप में स्थापित कर रहा है। यह कदम तेजी से विकसित हो रहे जनरेटिव AI क्षेत्र में मुख्यधारा के उपयोगकर्ताओं को आकर्षित करने के लिए पहुंच और विश्वास पर एक दांव का प्रतिनिधित्व करता है। यह तकनीक न केवल रचनाकारों के लिए नए रास्ते खोलती है, बल्कि यह भी सुनिश्चित करती है कि डिजिटल दुनिया में पारदर्शिता और प्रामाणिकता बनी रहे।