Google lance Gemini 2.5 Flash Image, révolutionnant la génération d'images

Édité par : Veronika Radoslavskaya

Google a officiellement dévoilé Gemini 2.5 Flash Image, un modèle d'intelligence artificielle de pointe, également connu sous le nom de code 'Nano Banana'. Ce nouveau système est conçu pour offrir aux utilisateurs un contrôle sans précédent sur la génération et la modification d'images, surmontant les limitations antérieures des outils d'édition d'images par IA.

Parmi ses fonctionnalités clés, Gemini 2.5 Flash Image permet la fusion multi-images, combinant plusieurs photographies en une seule composition cohérente. Il assure également la constance des personnages et des styles, garantissant que les sujets conservent leur apparence à travers diverses modifications. La transformation ciblée via des invites en langage naturel, comme la modification de couleurs ou la suppression d'éléments, est une autre capacité remarquable. De plus, le modèle intègre une connaissance du monde pour une génération d'images plus approfondie et pertinente, démontrant une compréhension sémantique avancée.

L'accessibilité de Gemini 2.5 Flash Image est large, disponible pour les utilisateurs gratuits et payants via l'application Gemini, ainsi que pour les développeurs par le biais de l'API Gemini, de Google AI Studio et de Vertex AI. Le coût pour les développeurs est fixé à 0,039 $ par image, ce qui le rend particulièrement compétitif par rapport aux offres existantes sur le marché. Pour prévenir les utilisations abusives, Google a mis en œuvre des mesures de sécurité robustes. Toutes les images générées ou modifiées par l'IA sont marquées par un filigrane visible et une étiquette numérique invisible, SynthID.

La performance de Gemini 2.5 Flash Image a été saluée dans des benchmarks tels que LMArena, où il a surpassé les modèles concurrents en termes de fidélité aux invites et de qualité d'édition, se distinguant particulièrement dans la cohérence des personnages et la recontextualisation de produits. L'intégration de Gemini 2.5 Flash Image dans des plateformes telles qu'Adobe Firefly et Adobe Express souligne son potentiel pour les créateurs et les entreprises. Les utilisateurs peuvent désormais prototyper des concepts, adapter des visuels pour divers formats et affiner des créations avec une efficacité accrue, ouvrant de nouvelles perspectives pour la création de contenu.

Sources

  • Republic World

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Google Gemini’s AI image model gets a ‘bananas’ upgrade

  • Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation

  • Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade

  • Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.