Google Lança Gemini 2.5 Flash Image: Revolucionando a Criação e Edição de Imagens com IA

Editado por: Veronika Radoslavskaya

O Google anunciou o lançamento do Gemini 2.5 Flash Image, um modelo avançado de inteligência artificial projetado para aprimorar significativamente a geração e edição de imagens. Anteriormente conhecido pelo codinome "Nano Banana", este modelo representa um avanço notável no controle criativo e na precisão para usuários e desenvolvedores.

Uma das principais inovações do Gemini 2.5 Flash Image é a sua capacidade de fusão de múltiplas imagens. Esta funcionalidade permite a combinação de diferentes fotografias em uma única imagem coesa, ideal para criar composições complexas, como integrar produtos em novos cenários ou remodelar ambientes com diferentes elementos decorativos. Além disso, o modelo garante a consistência de personagens e estilos, mantendo a semelhança de sujeitos em diversas edições, o que é crucial para narrativas visuais e branding.

O modelo também se destaca pela sua habilidade de realizar transformações direcionadas através de comandos em linguagem natural. Isso significa que os usuários podem solicitar edições específicas, como o desfoque de um fundo, a remoção de um objeto ou a alteração da pose de um sujeito, tudo por meio de descrições textuais simples. A integração do conhecimento mundial do Gemini permite uma geração de imagens mais profunda e contextualmente relevante, indo além do mero fotorrealismo para tarefas que exigem compreensão genuína, como a interpretação de diagramas ou a assistência em consultas educacionais.

O Gemini 2.5 Flash Image está acessível a todos os usuários através da aplicação Gemini, tanto para usuários gratuitos quanto pagos. Para desenvolvedores e empresas, o modelo está disponível através da API Gemini, Google AI Studio e Vertex AI. O custo para desenvolvedores é de $30,00 por um milhão de tokens de saída, o que se traduz em aproximadamente $0,039 por imagem.

Para mitigar o uso indevido e garantir a transparência, o Google implementou medidas de segurança robustas. Todas as imagens geradas ou editadas com o Gemini 2.5 Flash Image incluem uma marca d'água visível e uma etiqueta digital invisível, conhecida como SynthID. Esta tecnologia ajuda a identificar o conteúdo como gerado ou editado por IA, reforçando o compromisso do Google com o desenvolvimento responsável de IA. Avaliações em plataformas como a LMArena demonstraram uma preferência dos usuários superior em relação a concorrentes, destacando a capacidade do modelo de preservar detalhes e semelhanças em imagens editadas.

Com estas funcionalidades avançadas, o Google consolida a sua posição no mercado de edição de imagem com IA, oferecendo ferramentas precisas e intuitivas que abrem novas possibilidades criativas para uma vasta gama de usuários.

Fontes

  • Republic World

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Google Gemini’s AI image model gets a ‘bananas’ upgrade

  • Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation

  • Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade

  • Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

Encontrou um erro ou imprecisão?

Vamos considerar seus comentários assim que possível.