OpenAI ha recentemente lanciato due nuovi modelli open-weight, gpt-oss-120b e gpt-oss-20b, segnando un passo avanti verso la democratizzazione dell'intelligenza artificiale. Questi modelli sono disponibili per il download gratuito e offrono nuove opportunità per sviluppatori e aziende.
Si tratta dei primi modelli open-weight rilasciati da OpenAI dal 2019. I modelli gpt-oss sono progettati per attività di ragionamento avanzato e sono ottimizzati per funzionare in modo efficiente su vari tipi di hardware. Il modello gpt-oss-120b può essere eseguito su una singola GPU da 80 GB, mentre gpt-oss-20b richiede solo 16 GB di memoria, rendendolo ideale per l'uso su dispositivi edge e per l'inferenza locale.
Entrambi i modelli eccellono in attività come la programmazione, la matematica e le query relative alla salute. Sono stati addestrati utilizzando tecniche di reinforcement learning e sono compatibili con la Responses API di OpenAI.
La licenza Apache 2.0 consente l'uso, la modifica e la distribuzione senza restrizioni. Questo approccio contrasta con il modello tradizionale di OpenAI, focalizzato su un accesso proprietario.
Il modello gpt-oss-120b offre prestazioni quasi pari a o4-mini di OpenAI in diversi benchmark di ragionamento. Il modello gpt-oss-20b offre risultati simili a o3-mini di OpenAI. Entrambi i modelli supportano il "chain-of-thought reasoning".
I modelli sono progettati per supportare funzionalità come l'instruction-following e l'uso di strumenti, e sono stati addestrati su GPU NVIDIA H100. OpenAI ha collaborato con diverse organizzazioni per distribuire questi modelli.
OpenAI afferma che entrambi i modelli gpt-oss mostrano tassi di allucinazione più elevati rispetto ai modelli proprietari. La società ha sottoposto i modelli a test di sicurezza completi.
Questi modelli supportano lunghezze di contesto fino a 131.072 token. Il modello più piccolo ha 21 miliardi di parametri totali con 3,6 miliardi di parametri attivi, mentre il modello più grande ha 117 miliardi di parametri totali con 5,1 miliardi di parametri attivi.
I modelli gpt-oss sono disponibili per il download su Hugging Face.