Компанія OpenAI 25 вересня 2025 року представила GDPval – інноваційний еталон, розроблений для оцінки економічної цінності, яку штучний інтелект (ШІ) може генерувати в різних галузях та професіях. Цей новий інструмент покликаний перевести дискусію про можливості ШІ з теоретичних припущень у площину доведених результатів, відображаючи реальний внесок технологій у зростання продуктивності.
GDPval охоплює 44 професії у дев'яти ключових секторах економіки США, що складають значну частку ВВП. Тестування включає завдання, що базуються на реальній роботі професіоналів із середнім досвідом 14 років. Початкові результати показують, що модель GPT-5 від OpenAI демонструє конкурентоспроможність, досягаючи рівня експертів або перевершуючи їх у 40,6% випадків. Це майже втричі більше порівняно з показником GPT-4o, який становив 13,7% приблизно 15 місяцями раніше. Однак, модель Claude Opus 4.1 від Anthropic показала дещо кращі результати, не поступаючись експертам у 49% завдань.
OpenAI пояснює це частково естетичною привабливістю згенерованих діаграм, а не виключно вищою продуктивністю моделі. Цей еталон є важливим кроком уперед, оскільки він фокусується на вимірюванні реальної економічної цінності, яку ШІ може принести. На відміну від академічних тестів, GDPval імітує реальні робочі процеси, оцінюючи не лише якість звітів, але й потенціал для майбутніх, більш комплексних тестів, що охоплюватимуть ширший спектр завдань та інтерактивних робочих процесів. Це свідчить про прагнення OpenAI до створення більш глибокого розуміння можливостей ШІ.
Економічний вплив ШІ вже відчутний. За оцінками, генеративний ШІ може додати від 2,6 до 4,4 трильйона доларів щорічно до світової економіки, що становить 15-40% від загального економічного ефекту від ШІ. Очікується, що ШІ підвищить продуктивність праці на 0,1-0,6% щорічно до 2040 року. Це означає, що ШІ не просто автоматизує рутинні завдання, а й звільняє професіоналів для більш значущої та творчої роботи, сприяючи загальному економічному зростанню. Вартість використання GPT-5 також є значно нижчою порівняно з Claude Opus 4.1, що робить його більш доступним для широкого впровадження.
Впровадження GDPval підкреслює важливість об'єктивного вимірювання прогресу ШІ. Це дозволяє компаніям краще розуміти, як інвестувати в ШІ та як інтегрувати його в робочі процеси для досягнення максимальної ефективності. Подальший розвиток цього еталону обіцяє ще глибше розуміння потенціалу ШІ та його ролі у формуванні майбутнього праці.