Google lancia Gemini 2.5 Flash Image: l'IA per la generazione e l'editing di immagini

Modificato da: Veronika Radoslavskaya

Google ha presentato ufficialmente Gemini 2.5 Flash Image, il suo più recente modello di intelligenza artificiale dedicato alla generazione e all'editing di immagini. Soprannominato internamente "nano-banana", questo strumento avanzato mira a offrire agli utenti un controllo senza precedenti sulle modifiche fotografiche, superando i limiti delle precedenti capacità di editing di immagini basate sull'IA.

Le funzionalità distintive di Gemini 2.5 Flash Image includono la fusione multi-immagine, che permette di combinare più fotografie in un'unica immagine coerente, e la coerenza del personaggio, essenziale per mantenere l'identità di un soggetto attraverso diverse modifiche. Il modello supporta inoltre trasformazioni mirate tramite prompt in linguaggio naturale, sfruttando la conoscenza del mondo integrata in Gemini per generazioni di immagini più profonde e pertinenti. Questa capacità di comprensione contestuale e di applicazione di modifiche precise posiziona Gemini 2.5 Flash Image come uno strumento potente per la narrazione visiva e la creazione di contenuti di marca.

L'accesso a Gemini 2.5 Flash Image è disponibile sia per gli utenti gratuiti che per quelli a pagamento tramite l'app Gemini. Gli sviluppatori possono inoltre sfruttare il modello attraverso l'API Gemini, Google AI Studio e Vertex AI. Il costo per gli sviluppatori è di 30 dollari per 1 milione di token di output, con un costo approssimativo di 0,039 dollari per immagine, rendendolo una soluzione competitiva nel mercato dell'IA generativa.

Per affrontare le preoccupazioni relative a un potenziale uso improprio, Google ha implementato rigorose misure di sicurezza. Ogni immagine generata o modificata tramite Gemini 2.5 Flash Image è dotata di una filigrana digitale visibile e di un tag digitale invisibile, noto come SynthID. Queste precauzioni sono fondamentali per garantire la trasparenza e la provenienza dei contenuti generati dall'IA, distinguendoli dalle fotografie reali e mitigando il rischio di disinformazione.

L'introduzione di Gemini 2.5 Flash Image consolida ulteriormente la posizione di Google nel fiorente mercato dell'editing di immagini basato sull'IA. Le sue capacità avanzate, unite a un prezzo competitivo e a solide misure di sicurezza, lo rendono uno strumento prezioso per creativi, sviluppatori e aziende che cercano di sfruttare la potenza dell'intelligenza artificiale per le loro esigenze visive. Studi di preferenza degli utenti condotti su piattaforme come LMArena hanno mostrato che Gemini 2.5 Flash Image ottiene punteggi superiori rispetto ai principali concorrenti, evidenziando la sua efficacia e la soddisfazione degli utenti.

Fonti

  • Republic World

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Google Gemini’s AI image model gets a ‘bananas’ upgrade

  • Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation

  • Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade

  • Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.