OpenAI lanceert GPT-5.3 Codex: Een nieuwe standaard voor autonome codering en systeemprestaties
Bewerkt door: Veronika Radoslavskaya
OpenAI heeft de technologische wereld verrast met de introductie van GPT-5.3 Codex, wat momenteel wordt beschouwd als hun meest geavanceerde agentische systeem voor softwareontwikkeling. Deze nieuwe iteratie is niet zomaar een update, maar een fundamentele herziening van hoe kunstmatige intelligentie programmeurs kan ondersteunen in hun dagelijkse werkzaamheden.
In deze versie zijn de specifieke programmeervaardigheden van GPT-5.2-Codex samengevoegd met de superieure redeneercapaciteiten en de brede professionele kennis van het GPT-5.2-basismodel. Dit resulteert in een uniform en krachtig systeem dat zowel technische precisie als contextueel begrip biedt voor complexe softwarevraagstukken en architecturale uitdagingen.
Een opmerkelijk detail van de totstandkoming is dat een vroege versie van GPT-5.3 Codex een actieve rol speelde in zijn eigen creatieproces. Het engineeringteam van OpenAI maakte gebruik van de capaciteiten van het model om trainingsruns te debuggen, grootschalige implementaties te coördineren en de resultaten van diverse evaluaties nauwkeurig te analyseren tijdens de kritieke ontwikkelingsfase.
Het systeem gaat veel verder dan het simpelweg genereren van code op basis van tekstuele instructies. Het fungeert als een volledig autonome assistent die in staat is om complexe, meerstaps taken uit te voeren, zoals het automatiseren van routinematige programmeerklussen en het beheren van de volledige levenscyclus van softwareprojecten zonder constante menselijke tussenkomst.
Wat betreft de pure verwerkingskracht en efficiëntie is er een indrukwekkende vooruitgang geboekt, aangezien GPT-5.3 Codex maar liefst 25% sneller werkt dan zijn directe voorganger. Deze snelheidswinst is cruciaal voor ontwikkelaars die in real-time oplossingen nodig hebben voor hun programmeeruitdagingen en helpt bij het verkorten van de totale ontwikkeltijd.
Tijdens onafhankelijke tests op de Terminal-Bench 2.0 benchmark wist het model zelfs Claude Opus 4.6 te overtreffen. Het blonk met name uit in het gebruik van real-world terminalomgevingen, het accuraat uitvoeren van complexe commando's en het effectief afhandelen van onverwachte systeemfouten die tijdens de executie kunnen optreden.
De prestaties op de OSWorld-benchmark, die specifiek meet hoe goed AI-modellen een computer kunnen bedienen op een manier die vergelijkbaar is met menselijke gebruikers, laten een substantiële groei zien. Vroege rapportages plaatsen het model in de midden 60%, wat een duidelijke verschuiving markeert naar systemen die de volledige ontwikkelingscyclus kunnen beheersen.
Veiligheid is een integraal onderdeel van de nieuwe release, waarbij het model is geclassificeerd als 'High capability' op het gebied van Cybersecurity. Dit valt onder het Preparedness Framework van OpenAI en biedt uitgebreide ondersteuning voor defensief beveiligingsonderzoek, wat essentieel is voor het beschermen van moderne software-infrastructuren.
Op de SWE-Bench Pro-test behaalt het model vroege scores van ongeveer 56,8%. Hoewel dit op zichzelf al indrukwekkende cijfers zijn, valt Codex vooral op door de ongekende snelheid waarmee deze taken worden uitgevoerd, wat een direct voordeel biedt in competitieve en tijdgevoelige ontwikkelomgevingen.
Een innovatieve toevoeging aan de interface is de mogelijkheid tot interactieve sturing tijdens de uitvoering van taken. Gebruikers kunnen het model nu halverwege het proces bijsturen zonder dat de context van de lopende taak verloren gaat, wat een effectieve oplossing biedt voor continuïteitsproblemen die voorheen optraden bij langdurige opdrachten.
Om de interactie met deze nieuwe AI-agenten te optimaliseren, heeft OpenAI een speciale Codex-app voor macOS gelanceerd. Deze applicatie dient als een centraal commandocentrum waarvandaan ontwikkelaars hun agenten kunnen aansturen, monitoren en bijsturen in een vertrouwde en gestroomlijnde desktopomgeving.
De uitrol van GPT-5.3 Codex is inmiddels voltooid voor alle gebruikers met een betaald ChatGPT-abonnement. De focus ligt hierbij op een naadloze integratie in de bestaande workflows van programmeurs, zodat de overstap naar dit krachtigere systeem de dagelijkse productiviteit direct en merkbaar kan verhogen.
In de bredere marktcontext positioneert GPT-5.3 Codex zich recht tegenover Anthropic's Claude Opus 4.6, dat zich vooral richt op een contextvenster van 1 miljoen tokens. OpenAI kiest echter voor een bredere functionele aanpak door het model geschikt te maken voor vrijwel elke professionele computertaak, van het genereren van testsuites tot het opstellen van overdrachtdocumentatie.
2 Weergaven
Bronnen
WWWhat's new
The Week AI Broke Wall Street and the Gloves Came Off
OpenAI releases GPT-5.3-Codex, a coding model that helped build itself - Mashable
Our complete GPT 5.3 Codex review: A new era for agentic AI - eesel AI
OpenAI, Anthropic fight on the frontier - The Rundown AI
Introducing Claude Opus 4.6 - Anthropic
Lees meer nieuws over dit onderwerp:
Heb je een fout of onnauwkeurigheid gevonden?We zullen je opmerkingen zo snel mogelijk in overweging nemen.