Google Lance Gemini 2.5 Flash Image: Une Révolution dans la Création d'Images par IA

Édité par : gaya ❤️ one

Google a officiellement lancé Gemini 2.5 Flash Image, un modèle d'intelligence artificielle avancé pour la génération et l'édition d'images, désormais accessible aux développeurs et aux entreprises. Annoncé le 2 octobre 2025, cet outil de production est disponible via l'API Gemini, Google AI Studio et Vertex AI. Le modèle introduit la prise en charge de 10 rapports d'aspect différents, s'adaptant ainsi à une variété de plateformes, des paysages cinématographiques aux formats verticaux des réseaux sociaux. Une amélioration clé réside dans sa cohérence accrue des personnages, préservant leur ressemblance lors d'éditions majeures, ce qui résout un défi courant pour les modèles d'images IA.

Gemini 2.5 Flash Image dispose également d'une capacité multimodale native, lui permettant de traiter simultanément le texte et les images pour des modifications plus précises et cohérentes. Le prix est fixé à 0,039 $ par image et 30 $ par million de tokens de sortie, visant à stimuler l'adoption par les entreprises via Vertex AI. Les premiers utilisateurs ont salué ses capacités uniques. La startup IA Cartwheel a trouvé le modèle apte à gérer des poses complexes sous n'importe quel angle de caméra, le co-fondateur Andrew Carr notant sa capacité à fournir à la fois une fidélité à la pose et une « connaissance du monde », un exploit avec lequel d'autres modèles ont eu du mal.

Ce lancement est une réponse stratégique à un marché concurrentiel, intensifié par l'intégration par OpenAI de son générateur d'images GPT-4o dans ChatGPT. Google vise une adoption massive en ciblant un large public directement dans son application de chat. Pour lutter contre les deepfakes, Google met en œuvre des filigranes SynthID visibles et invisibles sur tout le contenu généré, indiquant clairement l'origine de l'IA. Cette technologie est développée par Google DeepMind, ce qui la distingue de l'approche de ses concurrents qui sont confrontés à des poursuites pour violation de droits d'auteur.

En intégrant des outils d'édition conviviaux dans son produit IA phare, Google positionne Gemini comme un moteur créatif complet. Cette décision représente un pari sur l'accessibilité et la confiance pour séduire les utilisateurs grand public dans le domaine en rapide évolution de l'IA générative.

Sources

  • WinBuzzer

  • Gemini Flash - Google DeepMind

  • Introducing Gemini 2.5 Flash Image, our state-of-the-art image model

  • Building next-gen visuals with Gemini 2.5 Flash Image (aka nano-banana) on Vertex AI

  • Google I/O 2025: Updates to Gemini 2.5 from Google DeepMind

  • Release notes | Gemini API | Google AI for Developers

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.