OpenAI、ヘルスケアにおけるAIモデルを評価するためのHealthBenchを発表

22:13, 13 5月

編集者： Veronika Radoslavskaya

OpenAIは2025年5月13日、ヘルスケアにおけるAIモデルを評価するための新しいデータセットであるHealthBenchを発表しました。その目標は、ポケットデバイスからアクセスできる24時間365日対応のAI医師を作成することです。このイニシアチブは、信頼できる医療アドバイスを提供するAIの能力を評価します。 HealthBenchは、AIモデルを医師が作成したルーブリックと比較するオープンソースのデータセットです。OpenAIのo3推論モデルが60%のスコアでリードしています。Grokが54%で続き、GoogleのGemini 2.5 Proは52%のスコアです。 24時間365日対応のAI医師というビジョンは、特に遠隔地において、ヘルスケアへのアクセスを革命的に変える可能性があります。ただし、AIモデルのリソース集約的な性質がアクセスを制限する可能性があります。データのプライバシーと誤った情報に関する倫理的な懸念も存在します。

このトピックに関するさらに多くのニュースを読む:

05 7月

セールスフォース、AIが最大50%の業務を処理 – デジタル労働革命の到来を示唆

05 7月

Freepik、プレミアムユーザー向けに無制限のAI画像生成サービスを開始

04 7月

EU、AI規制の導入延期要求を拒否：日本企業への影響は？

エラーや不正確な情報を見つけましたか？

できるだけ早くコメントを考慮します。