Google Luncurkan Gemini 2.5 Flash Image untuk Generasi dan Edit Gambar AI

Diedit oleh: gaya ❤️ one

Google telah secara resmi memperkenalkan Gemini 2.5 Flash Image, sebuah model kecerdasan buatan (AI) canggih yang dirancang untuk generasi dan pengeditan gambar. Model ini akan diumumkan pada 2 Oktober 2025 dan akan tersedia secara umum bagi para pengembang dan perusahaan melalui Gemini API, Google AI Studio, dan Vertex AI. Pengumuman ini akan menandai ketersediaan alat yang siap produksi ini.

Gemini 2.5 Flash Image menawarkan peningkatan signifikan, termasuk dukungan untuk 10 rasio aspek berbeda yang memenuhi kebutuhan berbagai platform, dari lanskap sinematik hingga format media sosial vertikal. Salah satu fitur unggulannya adalah peningkatan konsistensi karakter, yang mampu mempertahankan kemiripan subjek di berbagai pengeditan, mengatasi tantangan umum pada model AI gambar sebelumnya. Model ini juga dilengkapi kemampuan multimodal asli, memungkinkannya memproses teks dan gambar secara bersamaan untuk pengeditan yang lebih presisi dan konsisten.

Dalam hal harga, model ini dibanderol $0.039 per gambar, atau $30 per satu juta token output, sebuah strategi yang dirancang untuk mendorong adopsi perusahaan melalui Vertex AI. Para pengguna awal telah memberikan apresiasi tinggi terhadap kemampuannya yang unik. Startup AI Cartwheel mencatat bahwa model ini sangat mahir dalam menangani pose kompleks dari berbagai sudut kamera, dengan co-founder Andrew Carr menyoroti kemampuannya dalam memberikan kesetiaan pada pose sekaligus 'pengetahuan dunia', sebuah pencapaian yang sulit dilakukan oleh model lain.

Peluncuran ini merupakan respons strategis Google di tengah pasar yang kompetitif, terutama dengan integrasi generator gambar GPT-4o OpenAI ke dalam ChatGPT. Google berupaya mencapai adopsi massal dengan menargetkan audiens yang luas langsung di dalam aplikasi chatnya. Untuk memerangi deepfake, Google menerapkan watermark digital SynthID yang terlihat dan tidak terlihat pada semua konten yang dihasilkan, yang secara jelas menunjukkan asal AI. Dengan mengintegrasikan alat pengeditan yang ramah pengguna ke dalam produk AI handalannya, Google memposisikan Gemini sebagai mesin kreatif yang komprehensif. Langkah ini menandakan taruhan pada aksesibilitas dan kepercayaan untuk memenangkan pengguna arus utama di bidang AI generatif yang berkembang pesat.

Sumber-sumber

  • WinBuzzer

  • Gemini Flash - Google DeepMind

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI

  • Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind

  • Release notes | Gemini API | Google AI for Developers

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.