Google führt Gemini 3 ein
Google präsentiert Gemini 3: Der Beginn der Ära des „Tiefen Denkens“ und autonomer Agenten
Autor: Veronika Radoslavskaya
Zwei Jahre nach dem Beginn des generativen KI-Booms hat Google offiziell Gemini 3 vorgestellt. Dieses Modell soll einen Paradigmenwechsel einleiten: weg von Chatbots, die lediglich Text vorhersagen, hin zu KI-Agenten, die fähig sind zu argumentieren, zu planen und zu handeln. Die Veröffentlichung umfasst primär zwei Stufen: Gemini 3 Pro, das sofort verfügbar ist, und den leistungsstärkeren Modus Gemini 3 Deep Think, der darauf ausgelegt ist, komplexe Probleme zu bewältigen, indem er vor der Antwort „nachdenkt“.
Das herausragende Merkmal dieser neuen Generation ist die Konzentration auf das sogenannte „mechanistische Denken“ (mechanistic reasoning). Die sofortige Markteinführung von Gemini 3 Pro demonstriert bereits hochmoderne Argumentationsfähigkeiten. Das Modell erreichte beeindruckende 91,9% beim anspruchsvollen GPQA Diamond-Benchmark und 37,5% beim Humanity's Last Exam (HLE), und zwar ohne den Einsatz externer Werkzeuge. Diese Fähigkeit ermöglicht es dem Modell, Tiefe und Nuancen in Wissenschaft und Mathematik mit hoher Zuverlässigkeit zu erfassen.
Der neue Deep Think-Modus, der Ultra-Abonnenten in Kürze zur Verfügung stehen wird, verschiebt diese Grenzen noch weiter. Er wurde konzipiert, um die komplexesten und neuartigsten Probleme zu lösen. Beim ARC-AGI-2, einem strengen Benchmark, der die Fähigkeit einer KI testet, Logikrätsel zu lösen, die sie noch nie zuvor gesehen hat, erzielte Deep Think einen Wert von 45,1%. Auch beim HLE verbesserte es sich auf 41,0%. Dieser erweiterte Modus ist für echtes Problemlösen geschaffen und geht weit über die bloße Standard-Informationsabfrage und -Synthese hinaus.
Für Softwareentwickler geht die Einführung Hand in Hand mit einer neuen Plattform namens Google Antigravity. Diese „Agent-First“-Entwicklungsumgebung ermöglicht es Ingenieuren, direkt mit KI-Agenten zusammenzuarbeiten, die unmittelbaren Zugriff auf Terminals, Browser und Code-Editoren haben. Anstatt nur eine Codezeile zu vervollständigen, können diese Agenten komplexe Softwareaufgaben autonom planen, ausführen und validieren.
Google bezeichnet dies als das ultimative Werkzeug für „Vibe Coding“ – einen Programmierstil, bei dem sich Entwickler auf die kreative Absicht auf hoher Ebene konzentrieren, während die KI die Implementierungsdetails übernimmt.
Auf der Verbraucherseite nutzt Gemini 3 seine multimodalen Fähigkeiten und ein massives 1 Million Token Kontextfenster. Dies erlaubt es ihm, riesige Datenmengen zu verarbeiten – das entspricht über 1.500 Seiten Text oder kompletten Video-Vorlesungen. Dadurch kann es als personalisierter Coach fungieren: Beispielsweise kann das Modell ein Video eines Pickleball-Spiels analysieren, spezifische Mängel in der Technik des Benutzers identifizieren und anschließend einen maßgeschneiderten Trainingsplan erstellen. Für Studierende kann es wissenschaftliche Arbeiten oder lange Video-Tutorials aufnehmen und interaktive Lernhilfen wie Karteikarten oder Visualisierungen generieren, um ihnen bei der Beherrschung des Materials zu helfen. Es ist sogar in der Lage, handschriftliche Rezepte zu entziffern und in digitale Formate umzuwandeln.
Google beansprucht auch die Führungsposition auf den Ranglisten. Gemini 3 Pro hat bereits den ersten Platz auf LMArena eingenommen, einer Crowdsourcing-Benchmark-Seite, auf der Nutzer KI-Modelle blind bewerten, und erreichte einen Elo-Score von 1501. Der sofortige Aufstieg des Modells an die Spitze setzt das Erbe seines Vorgängers, Gemini 2.5 Pro, fort, der zuvor die hart umkämpfte Rangliste anführte.
Das Modell wird derzeit im gesamten Google-Ökosystem ausgerollt, einschließlich der Gemini App, Vertex AI und einem neuen „KI-Modus“ in Google Search, der interaktive Simulationen spontan generiert. Während der „Deep Think“-Modus noch für abschließende Sicherheitsüberprüfungen zurückgehalten wird, ist das Kernmodell Gemini 3 Pro ab heute live. Dies signalisiert, dass Google bereit ist, die „agentische“ KI in die Hände von Millionen zu legen.
Weitere Nachrichten zu diesem Thema lesen:
Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?
Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.
