OpenAI's o3 model heeft het Kaggle Game Arena schaaktoernooi gewonnen, dat plaatsvond van 5 tot 7 augustus 2025. Het model behaalde de overwinning zonder een enkele nederlaag, waarbij het in de finale xAI's Grok 4 versloeg met een score van 4-0. Google's Gemini 2.5 Flash eindigde op de derde plaats.
Het toernooi, georganiseerd op het door Google beheerde Kaggle-platform, evalueerde de strategische redeneervaardigheden van algemene taalmodellen (LLM's). De modellen voerden hun zetten in tekstvorm in, zonder toegang tot gespecialiseerde schaakengines. Schaakexperts zoals Hikaru Nakamura en Magnus Carlsen volgden de prestaties. Carlsen schatte de rating van Grok 4 op ongeveer 800 en die van OpenAI's o3 op rond de 1200, wat aangeeft dat deze algemene AI-modellen nog niet het niveau van professionele schakers bereiken, maar wel een indrukwekkende vooruitgang tonen in strategisch denken.
De modellen werden niet specifiek voor schaken getraind, maar moesten hun algemene redeneervermogen inzetten. De organisatie plant regelmatig vergelijkbare evenementen om de ontwikkeling van AI te stimuleren en de prestaties van modellen op verschillende gebieden te beoordelen. De resultaten bieden waardevolle inzichten in de manier waarop AI-modellen 'denken' en de toekomst van strategische intelligentie in AI, met potentiële toepassingen die verder reiken dan alleen schaken, zoals in logistiek en andere strategische planningstaken.