救急科におけるChatGPTの診断パフォーマンスの評価

編集者: Vera Mo

人工知能(AI)は、より良い診断と意思決定のために医療分野での利用が増加しています。ウェストバージニア大学(WVU)の新しい研究では、ChatGPTが救急科でどのように機能するかを調査しています。Gangqing "Michael" Hu率いるWVUの研究者たちは、医師のメモを使用して患者を診断するChatGPTの能力を評価しました。Scientific Reportsに掲載されたこの研究は、救急診断におけるAIの可能性と限界の両方を強調しています。 この研究は、さまざまなバージョンのChatGPTが実際の臨床データをどのように処理するかを調べることを目的としていました。研究者たちは、30件の救急症例から匿名化されたメモを使用しました。彼らはGPT-3.5、GPT-4、GPT-4o、およびo1シリーズに3つの診断を提案するように依頼しました。モデルの精度は、実際の患者の転帰と比較されました。 AIは、典型的な症状にはうまく対応しましたが、非典型的な症例には苦労しました。ChatGPTは、典型的な疾患兆候のある患者に対して正確に診断を提案しました。しかし、発熱のない肺炎のような複雑な症例では失敗しました。これは、AIが通常のトレーニングパターン外のデータに直面した場合の難しさを示しています。 現在のAIモデルは、主に医師のメモのような非構造化テキストを使用しています。画像や検査結果のような他の臨床データへのアクセスがありません。Huは、より多くのデータストリームを追加することで、AIの診断精度を向上させることができると示唆しています。これにより、AIはより包括的な臨床サポートツールになるでしょう。 新しいChatGPTモデルは、精度がわずかに向上しました。上位の診断推奨は15〜20%向上しました。しかし、一貫して高い精度を維持することは依然として課題です。これは、AI診断ツールを使用する際には人間の監視が必要であることを強調しています。 この研究は、医師がAI支援による診断を監督する必要があることを強調しています。医師の専門知識は、AIの出力を解釈し、正確な患者ケアを保証するために不可欠です。これにより、「ハイブリッドインテリジェンス」システムが作成されます。AIはデータ分析を加速し、臨床医は判断を提供します。 Huは、AIシステムがより透明で説明可能になることを望んでいます。AIは、医療提供者との信頼を築くために、その推論を明らかにする必要があります。この「説明可能なAI」は、臨床ワークフローへの統合を改善することができます。最終的には、これにより患者の転帰が改善されます。 Huのチームは、マルチエージェントAIシミュレーションも検討しています。これには、AIエージェントがパネルディスカッションで専門家としてロールプレイングすることが含まれます。目標は、共同診断プロセスを模倣することです。この会話型モデルは、より正確な評価につながる可能性があります。 研究者たちは、ChatGPTが認定された医療機器ではないことに注意を促しています。スタンドアロンの診断ソリューションとして使用すべきではありません。AIモデルは、特に拡張されたデータ型を使用する場合は、安全で準拠したシステムで動作する必要があります。規制の遵守と患者のプライバシーは不可欠です。 今後を見据えて、Huは研究がAIの推論を説明する能力に焦点を当てることを望んでいます。説明可能性の向上は、トリアージと治療の決定に役立つ可能性があります。これにより、効率と患者の安全性の両方を向上させることができます。

ソース元

  • Scienmag: Latest Science and Health News

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。