Anthropic ha annunciato il rilascio di Claude Sonnet 4.5, un modello di intelligenza artificiale che segna un notevole progresso nelle capacità di coding e ragionamento. Questo nuovo modello ha raggiunto una performance del 77,2% sul benchmark SWE-bench Verified, un indicatore chiave delle abilità di codifica nel mondo reale, superando i suoi predecessori e posizionandosi come leader nel settore. La sua efficacia è ulteriormente dimostrata dal punteggio di 61,4% su OSWorld, un benchmark che valuta l'interazione dei modelli AI con compiti informatici pratici. Claude Sonnet 4.5 è in grado di mantenere la concentrazione su compiti complessi e multi-fase per oltre 30 ore, un miglioramento significativo che apre nuove possibilità per lo sviluppo autonomo e la gestione di progetti estesi. Il modello si distingue anche per le sue prestazioni in ambiti specifici come finanza, legge e medicina, oltre a mostrare miglioramenti nell'allineamento e nella sicurezza, riducendo comportamenti indesiderati. Il prezzo di Claude Sonnet 4.5 rimane invariato rispetto alla versione precedente.
Oltre al modello principale, Anthropic ha introdotto una serie di innovazioni per potenziare l'ecosistema AI. Claude Code ora include "Code Checkpoints", una funzionalità attesa dagli sviluppatori che permette di salvare e ripristinare progressi in qualsiasi momento, offrendo una rete di sicurezza per l'esplorazione di alternative e il recupero da errori. L'API di Claude è stata arricchita con "context editing" e uno strumento di memoria, che consentono agli agenti AI di operare più a lungo e gestire una maggiore complessità, superando i limiti del contesto tradizionale. Inoltre, le applicazioni Claude ora integrano l'esecuzione di codice e la creazione di file direttamente all'interno delle conversazioni, semplificando i flussi di lavoro.
Per gli sviluppatori, Anthropic ha lanciato il Claude Agent SDK, una suite di strumenti che fornisce l'infrastruttura utilizzata internamente per costruire agenti AI avanzati. Questo SDK permette la creazione di agenti autonomi con un controllo granulare, sfruttando ampie finestre di contesto e pattern di sviluppo pronti per la produzione, facilitando la creazione di agenti per la gestione di codice, la revisione della sicurezza e l'assistenza in tempo reale. La disponibilità di Claude Sonnet 4.5 si estende a diverse piattaforme, tra cui la Claude Developer Platform, Amazon Bedrock e Google Cloud Vertex AI, oltre a essere integrato in GitHub Copilot per gli utenti Pro, Pro+, Business ed Enterprise.
Questo rilascio rafforza la posizione di Anthropic nel competitivo panorama dell'intelligenza artificiale, offrendo agli utenti e agli sviluppatori strumenti più potenti e flessibili per affrontare sfide complesse e stimolare l'innovazione.