![]()
研究顯示,AI雖能通過醫學考試,但是在臨床案例真實推理中表現不佳,尤其不擅長根據新信息更新判斷及識別無關信息,存在過度自信風險,目前的AI還不能“替代”醫生輔助診斷疾病。關注詳情。
(群規: 實名+機構)
閱讀文摘
一項研究指出,盡管人工智能(AI)在醫學資質考試中表現卓越,但在面對患者動態的、不確定的真實臨床案例及推理時,仍面臨挑戰。
該項研究利用名為“concor.dance”的基準測試工具(基于醫學教育中常用“腳本一致性測試”)評估了主流大型語言模型的臨床推理能力。測試模擬了醫生如何根據新癥狀和檢查結果,在不同診斷假設之間靈活地切換并篩選關鍵信息,最終確診疾病。
研究還發現,AI模型的表現大約相當于低年級醫學生(不是低年資醫生),遠未達到資深醫生的臨床診療水平。其核心缺陷在于:難以根據新的、不確定或不完全信息更新判斷。AI也經常無法識別哪些是無關信息,測試中約30%的干擾信息會被AI錯誤關聯。
更令人擔憂的是,旨在讓AI更“有用”的優化反而加劇了其“過度自信”問題,使其能極具說服力地解釋錯誤的診斷。
研究人員認為,通過醫生資質考試與進行臨床診療推理,其實是兩種不同技能。
研究結論:目前的AI無法“替代”醫生對疾病的診斷或病情判斷,AI技術仍在持續發展。因此,醫學界有責任積極參與,確保其被改進得安全、有效且符合患者利益,而不是被動接受其臨床應用。
![]()
關注我們,獲取生物醫學前沿最新資訊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.