Google revolutioniert KI-Bildgenerierung mit Gemini 2.5 Flash Image

09:26, 27 August

Bearbeitet von: Veronika Radoslavskaya

Google hat mit Gemini 2.5 Flash Image, auch bekannt unter dem Codenamen „Nano Banana“, eine neue Ära der KI-gestützten Bildgenerierung und -bearbeitung eingeläutet. Das fortschrittliche Modell verspricht, die Grenzen des visuell Möglichen mit künstlicher Intelligenz neu zu definieren, indem es Nutzern beispiellose Kontrolle und Verfeinerung bietet.

Gemini 2.5 Flash Image baut auf der multimodalen und fortschrittlichen Denkarchitektur von Gemini 2.5 auf, was ihm ermöglicht, sowohl Bilder als auch Text nahtlos zu verstehen und zu verarbeiten. Dies eröffnet vielfältige Möglichkeiten für kreative Workflows. Ein herausragendes Merkmal ist die Fähigkeit zur Multi-Image-Fusion, die es erlaubt, mehrere Bilder zu einem einzigen, kohärenten visuellen Werk zu verschmelzen. Dies ist besonders nützlich für komplexe Produktinszenierungen oder die Erstellung von Werbematerialien, bei denen verschiedene Elemente harmonisch integriert werden müssen. Darüber hinaus gewährleistet die Funktion zur Charakter- und Stil-Konsistenz, dass das Aussehen von Personen oder Objekten über verschiedene Bearbeitungen hinweg erhalten bleibt. Dies ist ein entscheidender Vorteil für Storytelling, Branding und die Erstellung konsistenter Assets.

Die präzise, auf natürlicher Sprache basierende Bildbearbeitung ermöglicht gezielte Transformationen. Nutzer können spezifische Anpassungen vornehmen, wie das Ändern von Kleidungsfarben, das Entfernen von Objekten oder das Anpassen von Posen, indem sie ihre Wünsche beschreiben. Diese Fähigkeit zur konversationellen Bearbeitung, die auch die Korrektur kleiner Details wie Flecken einschließt, macht den Prozess intuitiv und zugänglich. Darüber hinaus nutzt Gemini 2.5 Flash Image das breite Weltwissen von Gemini, um Aufgaben zu bewältigen, die ein tiefes semantisches Verständnis erfordern, wie die Interpretation von Diagrammen oder die Erstellung von Lerninhalten.

Für Entwickler und Unternehmen ist das Modell über die Gemini API, Google AI Studio und Vertex AI zugänglich. Die Preisgestaltung ist mit 0,039 US-Dollar pro Bild oder 30 US-Dollar pro 1 Million Ausgabetoken wettbewerbsfähig gestaltet. Um die verantwortungsvolle Nutzung von KI zu fördern, sind alle generierten oder bearbeiteten Bilder mit einer sichtbaren Wasserzeichen- und einer unsichtbaren digitalen Kennzeichnung durch SynthID versehen, die ihre Herkunft als KI-generiert oder -bearbeitet kennzeichnet. Die Leistung von Gemini 2.5 Flash Image wurde auf Plattformen wie LMArena umfassend getestet, wo es in Bezug auf Prompt-Treue und Bearbeitungsqualität führende Benchmarks erzielt und Konkurrenten übertrifft. Nutzer loben insbesondere die Fähigkeit des Modells, Details und Ähnlichkeiten über bearbeitete Bilder hinweg beizubehalten, was es zu einem leistungsstarken Werkzeug für Kreative und Unternehmen macht, die nach präzisen und konsistenten visuellen Ergebnissen suchen.

Mit seiner Kombination aus Geschwindigkeit, Präzision und fortgeschrittenen Bearbeitungsfunktionen positioniert sich Google mit Gemini 2.5 Flash Image als wichtiger Akteur auf dem wachsenden Markt für KI-Bildgenerierung, der bis 2031 voraussichtlich über 1 Milliarde US-Dollar erreichen wird.

Quellen

Republic World
Introducing Gemini 2.5 Flash Image, our state-of-the-art image model
Google Gemini’s AI image model gets a ‘bananas’ upgrade
Google Gemini 2.5 Flash Image brings a new 'bananas' upgrade to AI image generation
Nano banana is here: Google unveils Gemini 2.5 Flash Image upgrade
Google’s Gemini 2.5 Flash Image does it all – From blurring backgrounds to multi-image fusion

Weitere Nachrichten zu diesem Thema lesen:

11 September

Albaniens KI-Ministerin Diella: Ein Leuchtfeuer gegen Korruption?

09 September

Claude KI revolutioniert Dateierstellung und -bearbeitung

08 September

Amazon Kuiper erreicht 1,2 Gbit/s und setzt neue Maßstäbe in der Satellitenkommunikation

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.