OpenAI Luncurkan GDPval: Tonggak Baru dalam Mengukur Dampak Ekonomi AI

Diedit oleh: Veronika Radoslavskaya

Pada tanggal 25 September 2025, OpenAI mengumumkan peluncuran GDPval, sebuah tolok ukur inovatif yang dirancang untuk mengukur kinerja model kecerdasan buatan (AI) dalam menghasilkan nilai ekonomi di berbagai sektor industri. Inisiatif ini menandai langkah maju yang signifikan dalam memahami dan mengkuantifikasi kontribusi praktis AI terhadap perekonomian global.

GDPval mencakup sembilan industri utama dan 44 profesi berbeda, mulai dari insinyur perangkat lunak hingga jurnalis. Tolok ukur ini mengevaluasi kemampuan AI dalam tugas-tugas yang secara langsung menghasilkan nilai ekonomi, berbeda dari benchmark akademis tradisional. Dalam pengujian awal, model GPT-5 OpenAI menunjukkan performa yang kompetitif, dinilai setara atau lebih baik dari para ahli industri dalam 40,6% kasus. Namun, model Claude Opus 4.1 dari Anthropic sedikit mengungguli GPT-5 dengan tingkat kinerja yang tidak inferior sebesar 49% dalam tugas-tugas tertentu. OpenAI mencatat bahwa keunggulan Claude sebagian disebabkan oleh kemampuannya menghasilkan grafik yang lebih menarik secara visual, bukan semata-mata performa superior.

Kemajuan ini sangat pesat jika dibandingkan dengan model GPT-4o yang hanya mencapai 13,7% dalam metrik serupa sekitar 15 bulan sebelumnya, menunjukkan peningkatan hampir tiga kali lipat untuk GPT-5. Selain perbandingan performa, GDPval juga menyoroti aspek efisiensi biaya. Biaya panggilan API untuk GPT-5 dilaporkan lebih rendah dibandingkan Claude Opus 4.1, yaitu $1,25 per juta token input dan $10 per juta token output untuk GPT-5, berbanding $15 per juta token input dan $75 per juta token output untuk Claude Opus 4.1. Hal ini menunjukkan bahwa kemajuan AI tidak hanya berfokus pada kapabilitas, tetapi juga pada aksesibilitas dan keberlanjutan ekonomi.

Dampak AI terhadap ekonomi global semakin nyata. Laporan dari McKinsey Global Institute memperkirakan bahwa AI dapat menambah nilai ekonomi global hingga triliunan dolar, dengan sekitar 70% perusahaan diprediksi mengadopsi teknologi AI pada tahun 2030. AI tidak hanya meningkatkan produktivitas dan efisiensi operasional di berbagai sektor seperti manufaktur dan keuangan, tetapi juga mendorong inovasi produk dan layanan baru. Namun, perkembangan pesat ini juga menimbulkan pertanyaan mengenai potensi penggantian pekerjaan dan ketimpangan pendapatan.

OpenAI menyadari bahwa GDPval versi saat ini, yang berfokus pada pembuatan laporan, belum mencakup seluruh cakupan pekerjaan profesional. Oleh karena itu, perusahaan berencana untuk mengembangkan tes yang lebih komprehensif di masa depan, mencakup lebih banyak industri dan alur kerja interaktif. Langkah ini menegaskan komitmen OpenAI untuk terus menyempurnakan cara evaluasi AI, memastikan bahwa tolok ukur tersebut mencerminkan dampak ekonomi dunia nyata secara lebih akurat dan holistik. Perkembangan ini membuka peluang bagi para profesional untuk mengalihkan fokus mereka dari tugas-tugas rutin ke pekerjaan yang lebih bermakna, seiring AI mengambil alih sebagian beban kerja.

Sumber-sumber

  • 新浪财经

  • OpenAI发布GDPval基准测试,评估AI模型在经济价值工作中的表现

  • How GPT-5 compares to Claude Opus 4.1

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.

OpenAI Luncurkan GDPval: Tonggak Baru dala... | Gaya One