OpenAI Wprowadza GPT-5.2: Trójwarstwowa Architektura dla Zaawansowanych Przepływów Pracy

20:38, 11 grudnia

Autor: Veronika Radoslavskaya

OpenAI

@OpenAI

·Follow

Replying to @OpenAI

GPT-5.2 Thinking evals

6:18 PM · Dec 11, 2025

3.8K

Read 341 replies

Watch on X

OpenAI oficjalnie zaprezentowało model GPT-5.2 jedenastego grudnia 2025 roku. Ta nowa iteracja wprowadza system oparty na trzech wariantach, zaprojektowany z myślą o profesjonalnej pracy opartej na wiedzy oraz aplikacjach autonomicznych agentów. Firma podkreśla, że jest to ich najbardziej zaawansowany model do tej pory, oferujący mierzalne usprawnienia w generowaniu arkuszy kalkulacyjnych, tworzeniu prezentacji, programowaniu, przetwarzaniu obrazu oraz rozumowaniu w kontekście rozszerzonym.

Carl Vellotti 🥞

@carlvellotti

·Follow

Replying to @OpenAI

6:44 PM · Dec 11, 2025

Wyniki Testów i Przełomowe Osiągnięcia

Model GPT-5.2 Thinking ustanowił nowy rekord, osiągając stuprocentową celność w konkursie matematycznym AIME 2025. To wynik, który z pewnością przyciągnie uwagę świata akademickiego. Co więcej, w teście GDPval, który ocenia wiedzę w 44 różnych zawodach wymagających wiedzy, model dorównał lub prześcignął profesjonalistów w 70,9% bezpośrednich porównań. Jest to pierwszy raz, kiedy model od OpenAI osiągnął poziom ekspercki w zadaniach o znaczeniu ekonomicznym.

Na wewnętrznych wykresach porównawczych OpenAI, GPT-5.2 Thinking wyprzedza konkurencyjne rozwiązania, takie jak Gemini 3 od Google czy Claude Opus 4.5 od Anthropic, w niemal wszystkich testach rozumowania. Dotyczy to zarówno zaawansowanych benchmarków programistycznych, jak SWE-Bench Pro, jak i testów wiedzy ogólnej, w tym GPQA Diamond oraz pakietów ARC-AGI.

Postępy w Inżynierii Oprogramowania

W dziedzinie kodowania, GPT-5.2 Thinking wykazało znaczną poprawę. W teście SWE-Bench Pro, który sprawdza umiejętności inżynierskie w wielu językach programowania, model uzyskał wynik 55,6%, co stanowi poprawę w stosunku do 50,8% osiągniętego przez GPT-5.1. Dodatkowo, model osiągnął 80% w weryfikacji SWE-bench. Firmy zajmujące się rozwojem agentów kodujących, takie jak Windsurf i CharlieCode, zgłaszają już teraz wydajność na poziomie najlepszych w branży oraz zauważalny wzrost efektywności w realizacji złożonych, wieloetapowych zadań programistycznych.

Niezawodność GPT-5.2 Thinking również uległa znacznej poprawie – liczba błędów w odpowiedziach jest mniejsza o 30% w porównaniu do poprzednika. To czyni go bardziej godnym zaufania narzędziem do codziennego pisania i podejmowania decyzji badawczych. Model obsługuje okna kontekstowe liczone w setkach tysięcy tokenów, utrzymując niemal idealną rozdzielczość odniesień wielorundowych. Możliwości wizualne również zostały udoskonalone, redukując wskaźniki błędów o połowę w zadaniach interpretacji wykresów i rozumienia interfejsów oprogramowania.

Kontekst Rynkowy i Dostępność

Wprowadzenie GPT-5.2 następuje w momencie intensywnej rywalizacji z Gemini 3 od Google, które obecnie dominuje w większości rankingów LMArena, z wyjątkiem kodowania. Warto przypomnieć, że wcześniej w tym miesiącu pojawiły się doniesienia o wewnętrznym memo CEO Sama Altmana, określonym jako „kod czerwony”, sygnalizującym zmartwienia o utratę udziału w rynku konsumenckim na rzecz Google. Memo to miało nakazywać przesunięcie priorytetów, w tym odłożenie planów wprowadzania reklam i skupienie się na radykalnej poprawie doświadczenia użytkownika w ChatGPT.

Model GPT-5.2 jest stopniowo udostępniany subskrybentom płatnych planów ChatGPT (Plus, Pro, Business, Enterprise). Wszystkie trzy warianty są już dostępne za pośrednictwem interfejsu API. OpenAI ogłosiło również wdrożenie nowych protokołów bezpieczeństwa dotyczących wykorzystania narzędzia w kontekście zdrowia psychicznego oraz weryfikacji wieku dla nastolatków, choć te aspekty nie były głównym tematem podczas prezentacji.

OpenAI

ChatGPT

Reasoning AI

Large Language Models (LLMs)

Generative AI

38 Wyświetlenia

Źródła

OpenAI Blog

Czytaj więcej artykułów na ten temat:

27 kwietnia

DeepSeek-V4: Jak chińskie obniżki cen rzucają wyzwanie ekskluzywności sztucznej inteligencji

23 kwietnia

Niewidzialne emisje inteligentnych maszyn: Transparentność kosztów środowiskowych modeli LLM

09 kwietnia

Grammarly pozwane o naruszenie prawa do wizerunku w związku z edytorem stylów AI

Czy znalazłeś błąd lub niedokładność?Rozważymy Twoje uwagi tak szybko, jak to możliwe.