OpenAI, yapay zeka modellerinin ekonomik değer yaratma yeteneklerini değerlendirmek üzere tasarlanmış yeni bir kıyaslama aracı olan GDPval'ı duyurdu. 25 Eylül 2025'te tanıtılan bu araç, yapay zekanın profesyonellerin zamanını daha anlamlı işlere odaklanarak verimliliği nasıl artırabileceğini ölçmeyi hedefliyor.
GDPval, sağlık, finans ve üretim gibi dokuz ana sektörü ve yazılım mühendisleri, hemşireler ve gazeteciler gibi 44 farklı mesleği kapsıyor. İlk test sonuçlarına göre, OpenAI'ın GPT-5 modeli, vakaların %40,6'sında sektör uzmanlarına üstün veya onlarla eşit düzeyde performans gösterdi. Ancak, Anthropic'in Claude Opus 4.1 modeli, bazı metriklerde GPT-5'i geride bırakarak görevlerin %49'unda insan uzmanlara rakip olabilecek bir performans sergiledi. OpenAI, Claude'un daha yüksek puanını, saf performansından ziyade daha estetik açıdan hoş grafikler üretme eğilimine bağlıyor.
Bu kıyaslama, yapay zekanın ekonomik etkisini ölçmeye yönelik mevcut yaklaşımlardan farklı olarak, soyut akademik testler yerine gerçek dünya görevlerine odaklanıyor. OpenAI'ın kıdemli ekonomisti Dr. Aaron Chatterji'nin belirttiği gibi, "Bu sektörlerdeki insanlar artık modeli iş yüklerinin bir kısmını hafifletmek ve potansiyel olarak daha değerli şeylere odaklanmak için kullanabilirler." Bu durum, yapay zekanın iş gücüne entegrasyonunun sadece verimlilik artışı sağlamakla kalmayıp, aynı zamanda çalışanların daha stratejik ve yaratıcı rollere geçişini de teşvik edebileceği anlamına geliyor.
Thomson Reuters'ın bir raporuna göre, yapay zeka profesyonellerin haftada ortalama dört saat tasarruf etmesini sağlayarak, bu zamanın daha yaratıcı işlere veya stratejik düşünmeye ayrılmasına olanak tanıyor. GPT-5'in performansı, yaklaşık 15 ay önceki GPT-4o modeline kıyasla neredeyse üçe katlanarak önemli bir ilerleme kaydetti. GPT-5'in API çağrı maliyetleri de Claude Opus 4.1'e göre daha düşüktür.
OpenAI, gelecekteki GDPval testlerinin daha kapsamlı olacağını ve daha fazla endüstriyi ve etkileşimli iş akışlarını içereceğini belirtiyor. Bu yeni kıyaslama, yapay zekanın ekonomik değerini nicelleştirmede önemli bir adım olarak görülüyor ve sektördeki ilerlemeleri daha somut bir şekilde anlamamıza yardımcı oluyor. Yapay zekanın iş süreçlerini otomatikleştirmesiyle, çalışanların rutin görevlerden kurtularak daha stratejik ve yaratıcı faaliyetlere odaklanabileceği öngörülüyor. Bu durum, genel iş verimliliğini artırma potansiyeli taşıyor.