OpenAI lancia GPT-5.3 Codex: l'evoluzione dell'intelligenza artificiale tra auto-creazione e prestazioni record
Modificato da: Veronika Radoslavskaya
OpenAI ha ufficialmente presentato GPT-5.3 Codex, definendolo come il sistema di codifica agentica più avanzato e sofisticato mai realizzato fino ad oggi. Questa nuova iterazione rappresenta un punto di svolta tecnologico senza precedenti, poiché fonde sapientemente l'eccezionale abilità nella programmazione di GPT-5.2-Codex con le capacità di ragionamento logico superiore e la vasta conoscenza professionale del modello base GPT-5.2, creando così un'unica infrastruttura unificata di straordinaria potenza.
Un aspetto particolarmente affascinante dello sviluppo di questo modello risiede nella sua natura parzialmente auto-generativa. Una versione preliminare di GPT-5.3 Codex è stata infatti impiegata attivamente dal team di ingegneri di OpenAI per perfezionare il sistema stesso durante le fasi di gestazione. Lo strumento ha assistito i ricercatori nel debugging delle sessioni di addestramento, nella gestione della scalabilità delle implementazioni globali e nell'analisi meticolosa dei risultati di valutazione, contribuendo direttamente alla propria evoluzione.
Oltre alla semplice generazione di codice sorgente, il modello si propone come un assistente autonomo di nuova generazione, capace di gestire compiti multi-fase estremamente complessi. GPT-5.3 Codex non si limita a scrivere righe di comando isolate, ma è in grado di automatizzare le routine di programmazione più tediose e ripetitive, arrivando a supervisionare l'intero ciclo di vita di un progetto software, agendo come un vero e proprio collaboratore digitale intelligente per gli sviluppatori moderni.
Sul fronte delle prestazioni pure, i miglioramenti dichiarati sono tangibili e misurabili: GPT-5.3 Codex opera con una velocità di esecuzione superiore del 25% rispetto alla versione che lo ha preceduto. Test indipendenti condotti su larga scala hanno confermato la sua supremazia nel settore, evidenziando come il modello superi Claude Opus 4.6 nel benchmark Terminal-Bench 2.0. In questo contesto, Codex ha dimostrato un'eccellenza superiore in scenari d'uso reale del terminale, nell'esecuzione di comandi complessi e nella gestione proattiva degli errori di sistema.
I risultati ottenuti nel benchmark OSWorld, una metrica che valuta la capacità dei modelli di operare su un'interfaccia computerizzata in modo analogo a un utente umano, mostrano progressi significativi. GPT-5.3 Codex ha fatto registrare punteggi che si attestano stabilmente intorno alla metà del 60%, segnando un netto distacco rispetto alla versione precedente di Codex. Questo cambiamento di paradigma sottolinea l'importanza di sviluppare modelli capaci di gestire l'intero loop di sviluppo, superando la fase della mera scrittura del codice per abbracciare l'operatività totale.
Sotto il profilo della sicurezza informatica e della resilienza, il modello è stato classificato con una capacità di livello High secondo il rigoroso Preparedness Framework di OpenAI. Tale riconoscimento non è solo formale, ma è accompagnato da un supporto esteso per la ricerca sulla sicurezza difensiva, fornendo strumenti cruciali per la protezione delle infrastrutture. Inoltre, i punteggi iniziali registrati su SWE-Bench Pro si aggirano intorno al 56,8%, un ambito competitivo in cui Codex si distingue particolarmente per la sua rapidità di esecuzione e precisione.
Una delle innovazioni più rilevanti e attese riguarda l'integrazione e l'interfaccia utente, con l'introduzione della possibilità di guida interattiva durante l'esecuzione dei processi. GPT-5.3 Codex permette infatti agli utenti di orientare il modello a metà del lavoro senza che questo perda il contesto operativo o la memoria delle azioni precedenti. Questa funzione risolve i cronici problemi di continuità tipici dei compiti a lungo termine, offrendo un contrasto netto con l'approccio dei concorrenti focalizzato esclusivamente sulla pianificazione autonoma profonda.
Per facilitare questa interazione, è stata lanciata la nuova applicazione Codex per macOS, che funge da vero e proprio centro di comando per la direzione degli agenti basati su intelligenza artificiale. Attualmente, il sistema è già in fase di distribuzione per tutti gli utenti dei piani a pagamento di ChatGPT, con l'obiettivo dichiarato di integrarsi in modo fluido e naturale nei flussi di lavoro quotidiani degli sviluppatori professionisti di tutto il mondo.
Questa mossa strategica mira a trasformare radicalmente la produttività nel settore tecnologico, offrendo strumenti versatili che spaziano dalla generazione automatica di suite di test alla redazione di documenti tecnici per il passaggio di consegne. Nel contesto competitivo attuale, il rilascio di OpenAI si confronta direttamente con Claude Opus 4.6 di Anthropic, che punta su un ragionamento profondo e una finestra di contesto da un milione di token.
Tuttavia, GPT-5.3 Codex sceglie di ampliare ulteriormente il proprio raggio d'azione per affrontare quasi ogni tipo di attività informatica professionale immaginabile. Dalla gestione dei server alla creazione di documentazione complessa, il modello si candida a diventare lo standard de facto per la modernizzazione delle routine di sviluppo software, promettendo un futuro in cui l'interazione tra uomo e macchina sarà sempre più simbiotica e produttiva.
2 Visualizzazioni
Fonti
WWWhat's new
The Week AI Broke Wall Street and the Gloves Came Off
OpenAI releases GPT-5.3-Codex, a coding model that helped build itself - Mashable
Our complete GPT 5.3 Codex review: A new era for agentic AI - eesel AI
OpenAI, Anthropic fight on the frontier - The Rundown AI
Introducing Claude Opus 4.6 - Anthropic
Leggi altre notizie su questo argomento:
Hai trovato un errore o un'inaccuratezza?Esamineremo il tuo commento il prima possibile.