OpenAI представила HealthBench 13 травня 2025 року, новий набір даних для оцінки моделей штучного інтелекту в охороні здоров'я. Мета полягає в створенні цілодобового лікаря зі штучним інтелектом, доступного через кишеньковий пристрій. Ця ініціатива оцінює здатність штучного інтелекту надавати надійні медичні поради. HealthBench — це набір даних з відкритим кодом, який порівнює моделі штучного інтелекту з рубриками, написаними лікарями. Модель міркувань o3 від OpenAI лідирує з результатом 60%. Grok посідає друге місце з 54%, а Gemini 2.5 Pro від Google набирає 52%. Бачення цілодобового лікаря зі штучним інтелектом може революціонізувати доступність охорони здоров'я, особливо у віддалених районах. Однак ресурсомісткий характер моделей штучного інтелекту може обмежити доступність. Існують також етичні занепокоєння щодо конфіденційності даних і дезінформації.
OpenAI запускає HealthBench для оцінки моделей штучного інтелекту в охороні здоров'я
Відредаговано: Veronika Radoslavskaya
Читайте більше новин на цю тему:
Salesforce повідомляє, що штучний інтелект виконує до 50% робочого навантаження, відкриваючи нову еру цифрової праці
Freepik запускає безмежну генерацію зображень за допомогою ШІ для преміум-користувачів
ЄС відмовився від затримки впровадження Закону про штучний інтелект, незважаючи на тиск з боку промисловості
Знайшли помилку чи неточність?
Ми розглянемо ваші коментарі якомога швидше.