在 2025 年 8 月 5 日至 7 日舉行的 Kaggle 遊戲競技場西洋棋錦標賽中,OpenAI 的 o3 模型以 4-0 的絕對優勢擊敗了 xAI 的 Grok 4,贏得了冠軍。Google 的 Gemini 2.5 Pro 在銅牌爭奪戰中以 3.5-0.5 的比分擊敗了 OpenAI 的 o4-mini,獲得第三名。
世界西洋棋冠軍 Magnus Carlsen 擔任了本次賽事的評論員。他估計 OpenAI 的 o3 模型大約有 1200 的西洋棋等級分,而 Grok 4 的等級分約為 800。Carlsen 形容 o3 的表現「像一位西洋棋棋手」,在轉換時「相當無情」,而 Grok 4 則被指出犯下了許多失誤,包括多次丟失皇后。xAI 的創始人 Elon Musk 表示,該公司在 Grok 的西洋棋訓練上投入的資源極少,認為其西洋棋表現是更廣泛推理能力的「副作用」。本次錦標賽由 Kaggle 主辦,旨在評估通用型 AI 模型在推理和策略方面的能力。