OpenAI запускає HealthBench для оцінки моделей штучного інтелекту в охороні здоров'я

22:13, 13 травня

Відредаговано: Veronika Radoslavskaya

OpenAI представила HealthBench 13 травня 2025 року, новий набір даних для оцінки моделей штучного інтелекту в охороні здоров'я. Мета полягає в створенні цілодобового лікаря зі штучним інтелектом, доступного через кишеньковий пристрій. Ця ініціатива оцінює здатність штучного інтелекту надавати надійні медичні поради. HealthBench — це набір даних з відкритим кодом, який порівнює моделі штучного інтелекту з рубриками, написаними лікарями. Модель міркувань o3 від OpenAI лідирує з результатом 60%. Grok посідає друге місце з 54%, а Gemini 2.5 Pro від Google набирає 52%. Бачення цілодобового лікаря зі штучним інтелектом може революціонізувати доступність охорони здоров'я, особливо у віддалених районах. Однак ресурсомісткий характер моделей штучного інтелекту може обмежити доступність. Існують також етичні занепокоєння щодо конфіденційності даних і дезінформації.

Читайте більше новин на цю тему:

05 липня

Salesforce повідомляє, що штучний інтелект виконує до 50% робочого навантаження, відкриваючи нову еру цифрової праці

05 липня

Freepik запускає безмежну генерацію зображень за допомогою ШІ для преміум-користувачів

04 липня

ЄС відмовився від затримки впровадження Закону про штучний інтелект, незважаючи на тиск з боку промисловості

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.