近年來,人工智能在醫療領域的應用不斷擴大。最近,一項研究顯示,OpenAI 開發的聊天機器人 ChatGPT-4在診斷準確性方面竟超越了醫生,引發了廣泛的討論和關注。
該研究發表於《JAMA 網絡開放》期刊,測試了50位醫生在六個複雜病例上的表現。結果顯示,使用 ChatGPT 輔助的醫生平均得分爲76%,而未使用該工具的醫生僅爲74%。令人震驚的是,ChatGPT 單獨進行診斷時的準確率達到了90%。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
研究者爲了避免參與者或 AI 模型的先驗知識,使用了真實的、未公開的病例歷史。這些病例包括一些複雜的醫療狀況,比如膽固醇栓塞,這是一種常常被忽視的稀有疾病。醫生們在獨立醫療專家的評分下,提供可能的診斷、排除替代方案並建議下一步的診斷步驟。儘管許多醫生得到了 ChatGPT 的支持,但他們仍然難以匹敵 AI 的表現。
研究揭示了兩個主要問題:首先,醫生們往固守自己的初始診斷,尤其是在 ChatGPT 的建議與他們的看法相悖時。其次,很多醫生沒有充分利用 AI 工具的能力,往往只提出狹窄的問題,而未能全面分析病例歷史。
專家們認爲,現代 AI 工具通過語言模型對複雜病例進行細緻分析,展現出了巨大的潛力。與早期計算機輔助診斷不同,現代 AI 工具並不試圖模擬人類推理,而是通過處理和預測語言模式而表現出色。
儘管如此,專家們警告說,將 AI 融入醫療工作流程的過程不會一帆風順。常見的挑戰包括缺乏 AI 培訓、醫生對 AI 的牴觸情緒以及有關倫理和法律的擔憂。這些因素都可能阻礙 AI 作爲 “醫生延伸工具” 的潛力,影響其在提高診斷準確性方面的作用。
研究人員在分析聊天記錄時發現,許多醫生忽視了 ChatGPT 的建議。這種抵制心理部分源於他們對自身專業知識的過度自信,同時也因爲缺乏對 AI 診斷能力的瞭解。
這項研究的結果強調了 AI 開發者與醫療專業人員之間合作的重要性,以增強信任和可用性。未來,AI 在醫學中的角色可能會超越診斷,延伸至個性化治療規劃和病人管理等領域。儘管 AI 是一個非凡的工具,但如何有效地將其融入醫療實踐中仍然需要大量的努力。
劃重點:
🩺 ChatGPT-4在醫療診斷研究中表現出90% 的準確率,超越了醫生使用 ChatGPT 輔助的76% 。
📊 醫生們往往對自己的初始診斷過於自信,忽視了 AI 建議。
🤖 AI 工具在醫療中的潛力巨大,但缺乏培訓和信任是當前主要挑戰。
