Модель GPT-5.2 від OpenAI демонструє високі результати на вступних іспитах до університетів Японії

Відредаговано: Veronika Radoslavskaya

Результати спільного тестування, проведеного газетою Nikkei та японським стартапом LifePrompt 20 січня 2026 року, виявили значні досягнення штучного інтелекту у сфері академічного оцінювання. Модель GPT-5.2 Thinking від OpenAI продемонструвала високу продуктивність на Комплексному тесті для вступу до університетів Японії (Common Test for University Admissions), який відбувся 17 та 18 січня 2026 року. Цей експеримент, що охопив 15 ключових дисциплін, підкреслює розвиток можливостей ШІ у вирішенні складних академічних завдань.

Загальний бал моделі OpenAI склав 96,9 зі 100 можливих, при цьому вона здобула абсолютні бали у дев'яти з п'ятнадцяти протестованих предметів. Конкуруюча модель, Gemini 3.0 Pro від Google, також показала високий результат, набравши 91,4 бала загалом у цьому ж тестуванні. Для порівняння, очікуваний середній бал для абітурієнтів-людей за тими ж 15 популярними предметами у 2026 році оцінювався на рівні 58,1. Ця різниця у продуктивності свідчить про те, що передові ШІ-системи значно перевищують середній людський рівень у стандартизованих академічних випробуваннях.

Прогрес у продуктивності моделей є помітним: середній бал моделей OpenAI зріс із 66 у 2024 році до 91 у 2025 році. Аналіз результатів виявив, що моделі показали виняткову ефективність у кількісних дисциплінах, таких як математика, фізика, хімія та біологія. Однак, були зафіксовані труднощі у гуманітарних науках та завданнях, що вимагають просторового мислення, зокрема при інтерпретації світових карт, що вказує на поточні обмеження ШІ у розпізнаванні складної графічної інформації.

Ця подія має наслідки для освітніх систем, продовжуючи традицію попередніх досліджень. Наприклад, проєкт To-Robo-kun, розроблений Національним інститутом інформатики (NII), ще у 2015 році намагався скласти іспит до Токійського університету. Комплексний тест для вступу до університетів, який використовується 813 університетами, є суворим еталоном академічної підготовки. Поточні результати GPT-5.2 Thinking, що наближаються до досконалості у структурованих галузях, водночас виявляють, що для досягнення повної універсальності ШІ необхідно подолати бар'єри, пов'язані зі складним візуальним та культурним контекстом.

3 Перегляди

Джерела

  • AGERPRES

  • China.org.cn

  • Xinhua

  • Nippon.com

  • OfficeChai

  • EvoLink.AI

Знайшли помилку чи неточність?Ми розглянемо ваші коментарі якомога швидше.