OpenAI präsentiert GPT-5.2: Dreistufige Architektur für professionelle Arbeitsabläufe

Autor: Veronika Radoslavskaya

Am 11. Dezember 2025 gab OpenAI die offizielle Einführung von GPT-5.2 bekannt. Dieses neue Modellsystem zeichnet sich durch eine dreiteilige Architektur aus, die gezielt für anspruchsvolle Wissensarbeit und autonome Agentenanwendungen konzipiert wurde. Das Unternehmen positioniert diese Veröffentlichung als seine bisher leistungsfähigste Modellreihe, die messbare Fortschritte in Bereichen wie der Erstellung von Tabellenkalkulationen, Präsentationserstellung, Programmierung, Bildverarbeitung und dem Verständnis von erweitertem Kontext aufweist.

Die GPT-5.2-Familie gliedert sich in drei spezialisierte Konfigurationen: Instant, Thinking und Pro. Jede dieser Varianten ist für unterschiedliche Komplexitätsgrade und Nutzungsszenarien optimiert. Die Instant-Version legt den Fokus auf Geschwindigkeit für alltägliche Anfragen, wie etwa Informationssuche, Textgenerierung und Übersetzungen. Im Gegensatz dazu brilliert Thinking bei strukturierten, komplexen Aufgaben wie der Programmierung, der Analyse umfangreicher Dokumente, mathematischen Berechnungen und detaillierter Planung.

Die höchste Leistungsstufe bildet die Pro-Konfiguration. Diese ist darauf ausgelegt, maximale Zuverlässigkeit und Genauigkeit bei den schwierigsten Problemen zu gewährleisten. Diese Differenzierung ermöglicht es Nutzern, je nach Anforderung das passende Werkzeug zu wählen, was eine effizientere Ressourcennutzung verspricht, anstatt immer nur auf das leistungsstärkste Modell zurückgreifen zu müssen.

Hinsichtlich der Benchmark-Leistung setzte GPT-5.2 Thinking neue Maßstäbe. Es erreichte eine hundertprozentige Fehlerfreiheit bei der Mathematikprüfung des AIME 2025 Wettbewerbs, was einen neuen Rekord darstellt. Weiterhin konnte das Modell bei GDPval – einer Evaluierung, die Wissensarbeit über 44 verschiedene Berufe hinweg misst – in 70,9 % der direkten Vergleiche mit Industrieexperten gewinnen oder gleichziehen. Dies markiert das erste Mal, dass ein OpenAI-Modell ein Expertenniveau bei ökonomisch relevanten Aufgaben erreicht hat.

In den internen Leistungstabellen von OpenAI übertrifft GPT-5.2 Thinking die Konkurrenzmodelle Gemini 3 von Google und Claude Opus 4.5 von Anthropic in nahezu allen aufgeführten Schlussfolgerungstests. Dies umfasst anspruchsvolle Suiten wie SWE-Bench Pro, GPQA Diamond und ARC-AGI.

Besonders im Bereich Softwareentwicklung und Programmierung zeigt sich die Stärke. Auf SWE-Bench Pro, einem praxisnahen Test, der verschiedene Programmiersprachen bewertet, erzielte GPT-5.2 Thinking eine Quote von 55,6 %, womit es die 50,8 % von GPT-5.1 übertrifft. Zudem erreichte es 80 % bei SWE-bench Verified. Führende Coding-Start-ups wie Windsurf und CharlieCode berichten von Spitzenleistungen ihrer Agenten beim Programmieren und verzeichnen deutliche Verbesserungen bei komplexen, mehrstufigen Arbeitsabläufen.

Die Zuverlässigkeit von GPT-5.2 Thinking wurde ebenfalls signifikant gesteigert. Die Antworten dieses Modells weisen 30 % weniger Fehler auf als jene von GPT-5.1, was es für alltägliche Entscheidungsfindungen, Recherchen und schriftliche Arbeiten deutlich vertrauenswürdiger macht. Das Modell unterstützt Kontextfenster, die Hunderttausende von Tokens umfassen, und liefert nahezu perfekte Ergebnisse bei mehrstufigen Referenzauflösungsaufgaben. Auch die visuellen Fähigkeiten wurden stark verbessert: Die Fehlerquoten bei der Interpretation von Diagrammen und dem Verständnis von Software-Oberflächen halbierten sich nahezu.

Diese Einführung erfolgt vor dem Hintergrund eines verschärften Wettbewerbs mit Googles Gemini 3, welches derzeit in den meisten Benchmarks, ausgenommen dem Coding-Bereich, die LMArena-Rangliste anführt. Erst kürzlich soll CEO Sam Altman ein internes „Code Red“-Memo an seine Mitarbeiter versandt haben, in dem er auf sinkende ChatGPT-Trafficzahlen und die Sorge vor dem Verlust von Marktanteilen im Konsumentenbereich an Google einging. Das Memo forderte eine Prioritätenverschiebung, einschließlich der vorläufigen Einstellung von Vorhaben wie der Einführung von Werbung, um sich stattdessen auf die Schaffung eines besseren ChatGPT-Erlebnisses zu konzentrieren.

GPT-5.2 wird schrittweise für zahlende ChatGPT-Abonnenten (Plus, Pro, Business, Enterprise) ausgerollt und steht über die API sofort in allen drei Varianten zur Verfügung. OpenAI kündigte zudem neue Sicherheitsmaßnahmen bezüglich der Nutzung im Bereich psychischer Gesundheit und der Altersverifizierung für Jugendliche an, wenngleich diese Punkte bei der offiziellen Vorstellung nicht im Vordergrund standen.

23 Ansichten

Quellen

  • OpenAI Blog

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.