Đánh giá Hiệu suất Chẩn đoán của ChatGPT tại Các Khoa Cấp cứu

Chỉnh sửa bởi: Vera Mo

Đánh giá Hiệu suất Chẩn đoán của ChatGPT tại Các Khoa Cấp cứu

Trí tuệ nhân tạo (AI) ngày càng được sử dụng trong lĩnh vực chăm sóc sức khỏe để đưa ra các chẩn đoán và quyết định tốt hơn. Một nghiên cứu mới từ Đại học West Virginia (WVU) xem xét cách ChatGPT hoạt động trong các phòng cấp cứu. Các nhà khoa học WVU, do Gangqing "Michael" Hu dẫn đầu, đã đánh giá khả năng chẩn đoán bệnh nhân của ChatGPT bằng cách sử dụng ghi chú của bác sĩ. Nghiên cứu, được công bố trên Scientific Reports, làm nổi bật cả tiềm năng và hạn chế của AI trong chẩn đoán cấp cứu.

Nghiên cứu nhằm mục đích xem các phiên bản ChatGPT khác nhau xử lý dữ liệu lâm sàng thực tế như thế nào. Các nhà nghiên cứu đã sử dụng các ghi chú đã được loại bỏ thông tin nhận dạng từ 30 trường hợp cấp cứu. Họ yêu cầu GPT-3.5, GPT-4, GPT-4o và loạt o1 đề xuất ba chẩn đoán. Độ chính xác của các mô hình được so sánh với kết quả thực tế của bệnh nhân.

AI hoạt động tốt với các triệu chứng cổ điển nhưng gặp khó khăn với các trường hợp không điển hình. ChatGPT đã đề xuất chính xác các chẩn đoán cho bệnh nhân có các dấu hiệu bệnh điển hình. Tuy nhiên, nó thất bại trong các trường hợp phức tạp, chẳng hạn như viêm phổi không sốt. Điều này cho thấy AI gặp khó khăn khi đối mặt với dữ liệu nằm ngoài các mẫu đào tạo thông thường của nó.

Các mô hình AI hiện tại chủ yếu sử dụng văn bản phi cấu trúc, chẳng hạn như ghi chú của bác sĩ. Chúng thiếu quyền truy cập vào các dữ liệu lâm sàng khác như hình ảnh và kết quả xét nghiệm. Hu gợi ý rằng việc thêm nhiều luồng dữ liệu hơn có thể cải thiện độ chính xác chẩn đoán của AI. Điều này sẽ làm cho AI trở thành một công cụ hỗ trợ lâm sàng toàn diện hơn.

Các mô hình ChatGPT mới hơn cho thấy sự cải thiện nhỏ về độ chính xác. Đề xuất chẩn đoán hàng đầu đã được cải thiện từ 15 đến 20 phần trăm. Tuy nhiên, độ chính xác cao nhất quán vẫn là một thách thức. Điều này nhấn mạnh sự cần thiết phải có sự giám sát của con người khi sử dụng các công cụ chẩn đoán AI.

Nghiên cứu nhấn mạnh rằng các bác sĩ phải giám sát các chẩn đoán có sự hỗ trợ của AI. Chuyên môn của bác sĩ là rất quan trọng để giải thích các kết quả đầu ra của AI và đảm bảo chăm sóc bệnh nhân chính xác. Điều này tạo ra một hệ thống "trí tuệ kết hợp". AI tăng tốc phân tích dữ liệu, trong khi các bác sĩ lâm sàng đưa ra đánh giá.

Hu muốn các hệ thống AI minh bạch và dễ giải thích hơn. AI nên tiết lộ lý do của mình để xây dựng lòng tin với các nhà cung cấp dịch vụ chăm sóc sức khỏe. "AI có thể giải thích" này có thể cải thiện khả năng tích hợp vào quy trình làm việc lâm sàng. Cuối cùng, điều này sẽ cải thiện kết quả của bệnh nhân.

Nhóm của Hu cũng đang khám phá các mô phỏng AI đa tác nhân. Điều này liên quan đến việc các tác nhân AI đóng vai các chuyên gia trong các cuộc thảo luận nhóm. Mục tiêu là để bắt chước các quy trình chẩn đoán hợp tác. Mô hình đàm thoại này có thể dẫn đến các đánh giá chính xác hơn.

Các nhà nghiên cứu cảnh báo rằng ChatGPT không phải là một thiết bị y tế được chứng nhận. Nó không nên được sử dụng như một giải pháp chẩn đoán độc lập. Các mô hình AI phải hoạt động trong các hệ thống an toàn, tuân thủ, đặc biệt khi sử dụng các loại dữ liệu mở rộng. Tuân thủ các quy định và quyền riêng tư của bệnh nhân là điều cần thiết.

Nhìn về phía trước, Hu muốn nghiên cứu tập trung vào khả năng giải thích lý do của AI. Khả năng giải thích được cải thiện có thể giúp đưa ra các quyết định phân loại và điều trị. Điều này có thể cải thiện cả hiệu quả và sự an toàn của bệnh nhân.

Nguồn

  • Scienmag: Latest Science and Health News

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.