OpenAIは2025年5月13日、ヘルスケアにおけるAIモデルを評価するための新しいデータセットであるHealthBenchを発表しました。その目標は、ポケットデバイスからアクセスできる24時間365日対応のAI医師を作成することです。このイニシアチブは、信頼できる医療アドバイスを提供するAIの能力を評価します。 HealthBenchは、AIモデルを医師が作成したルーブリックと比較するオープンソースのデータセットです。OpenAIのo3推論モデルが60%のスコアでリードしています。Grokが54%で続き、GoogleのGemini 2.5 Proは52%のスコアです。 24時間365日対応のAI医師というビジョンは、特に遠隔地において、ヘルスケアへのアクセスを革命的に変える可能性があります。ただし、AIモデルのリソース集約的な性質がアクセスを制限する可能性があります。データのプライバシーと誤った情報に関する倫理的な懸念も存在します。
OpenAI、ヘルスケアにおけるAIモデルを評価するためのHealthBenchを発表
編集者: Veronika Nazarova
このトピックに関するさらに多くのニュースを読む:
エラーや不正確な情報を見つけましたか?
できるだけ早くコメントを考慮します。