GPT-5.2 Raih Skor Nyaris Sempurna dalam Ujian Masuk Universitas Jepang 2026
Diedit oleh: Veronika Radoslavskaya
Model kecerdasan buatan (AI) terbaru menunjukkan kemajuan signifikan dalam menghadapi penilaian akademik ketat, sebagaimana terungkap dalam eksperimen yang dilaporkan pada Selasa, 20 Januari 2026. Uji coba bersama yang diselenggarakan oleh surat kabar Nikkei dan perusahaan rintisan AI Jepang, LifePrompt, menguji model-model AI terkemuka, termasuk dari OpenAI dan Google, menggunakan soal dari 15 mata pelajaran utama Ujian Tes Umum untuk Penerimaan Universitas Jepang tahun 2026, yang sesungguhnya dilaksanakan pada 17 hingga 18 Januari 2026.
Model GPT-5.2 Thinking dari OpenAI mencatatkan skor keseluruhan 96,9 dari 100, berhasil meraih nilai sempurna dalam sembilan dari 15 subjek yang diujikan. Hasil ini menggarisbawahi laju perkembangan kapabilitas AI dalam menghadapi tolok ukur akademis yang kompleks dan berstandar tinggi di Jepang. Performa model AI tersebut secara substansial melampaui estimasi rata-rata skor peserta ujian manusia untuk 15 mata pelajaran populer di tahun 2026, yang diperkirakan hanya mencapai 58,1. Perkembangan ini melanjutkan tren peningkatan performa, di mana model OpenAI sebelumnya mencatatkan skor rata-rata 66 pada tahun 2024 dan meningkat menjadi 91 pada tahun 2025. Dalam uji coba yang sama, Gemini 3.0 Pro dari Google menunjukkan kapabilitas kuat dengan skor keseluruhan 91,4.
Analisis mendalam dari hasil uji coba menyoroti dikotomi dalam kemampuan AI; model-model tersebut menunjukkan keunggulan substansial dalam mata pelajaran kuantitatif seperti matematika, fisika, kimia, dan biologi. Satoshi Endo, kepala LifePrompt, mengaitkan pencapaian nilai sempurna dalam matematika dengan peningkatan kemampuan pemrosesan dan pembacaan AI. Namun, terdapat keterbatasan yang jelas dalam domain humaniora dan penalaran spasial, yang memerlukan interpretasi informasi grafis yang tidak teratur dan rumit. Secara spesifik, model-model tersebut membuat kesalahan dalam menafsirkan peta dunia, meskipun mereka mampu menginterpretasikan bentuk geometris dalam matematika dengan benar.
Eksperimen semacam ini merupakan kelanjutan dari upaya sebelumnya, termasuk proyek To-Robo-kun oleh National Institute of Informatics (NII) yang pada tahun 2015 telah mencetak skor di atas rata-rata dalam ujian Universitas Tokyo. Proyek To-Robo-kun, yang dipimpin oleh Dr. Noriko Arai dari NII, bertujuan memetakan kekuatan dan kelemahan AI dalam ranah kerja intelektual, yang diyakini telah memengaruhi perubahan kebijakan pendidikan Jepang menuju respons bebas dan pemikiran kritis. Implikasi dari kinerja GPT-5.2 Thinking yang mendekati kesempurnaan ini sangat luas, terutama bagi sektor pendidikan tinggi di Jepang, di mana 813 institusi, termasuk 81 universitas nasional, menggunakan hasil Tes Umum untuk proses penyaringan penerimaan.
3 Tampilan
Sumber-sumber
AGERPRES
China.org.cn
Xinhua
Nippon.com
OfficeChai
EvoLink.AI
Baca lebih banyak berita tentang topik ini:
Apakah Anda menemukan kesalahan atau ketidakakuratan?Kami akan mempertimbangkan komentar Anda sesegera mungkin.
