<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      咨詢AI醫生還不如上網搜索靠譜?《自然-醫學》:對普通人來說,確實如此

      0
      分享至

      ·AI本身的能力與人類使用這種能力的效率之間存在巨大鴻溝。

      AI醫生是否真的可靠?其性能能否僅靠增加算力來提升?2月10日發表在《自然-醫學》上的一項新研究顯示,對于普通人來說,答案是否定的。

      在該研究中,來自牛津大學等機構的研究人員招募了1298名英國參與者,讓他們在10個醫學場景中做出判斷——比如突然劇烈頭痛應該去哪個醫療機構就診,以及可能患的是什么疾病。參與者被隨機分配到四個實驗組:三個治療組分別使用GPT-4o、Llama 3或Command R+三種不同的大語言模型來輔助決策,而對照組則使用他們平時在家會用的任何方法,主要是互聯網搜索。

      當研究人員直接將醫學場景的信息輸入給這些大語言模型時,它們的表現非常好。GPT-4o能在94.7%的情況下指出至少一個相關的醫學診斷,在64.7%的情況下給出正確的醫療建議。Llama 3和Command R+的表現也大同小異。說明它們確實掌握了大量的醫學信息。

      然而,當普通人使用這些相同的模型時,情況就不一樣了。使用大語言模型的參與者在識別相關醫學條件方面的表現變得更差,只有不到34.5%的準確率。他們在判斷醫療優先級方面的表現也沒有超過對照組,兩者的準確率均為44%左右。

      換句話說,讓患者自己咨詢AI醫生,結果可能還不如上網搜索。

      這一結果表明AI本身的能力與人類使用這種能力的效率之間存在巨大鴻溝。研究團隊分析了參與者與大語言模型之間的對話記錄,發現了一系列系統性的問題。首先是信息傳遞的不通暢。大語言模型在對話中提到相關癥狀的比例大約在65%-73%之間,遠低于它們單獨工作時的表現,這說明人類患者往往沒有向AI系統提供足夠的信息。

      超過一半的患者在最初描述癥狀時沒有提供完整的信息。他們可能只說“頭很疼”,而沒有提到“突然發作”或“伴有頸部僵硬”這樣的關鍵癥狀。有時候,患者會在AI的提問下逐步補充信息,但有時候他們根本不補充。

      作者們指出,與之相比,醫生之所以能診斷患者,不僅是因為他們知識豐富,更因為他們知道要問什么問題。一個非專業的患者可能不知道哪些癥狀是診斷的關鍵。

      研究者們還發現,即使AI系統給出了正確建議,人類也不一定會采納。參與者平均列出1.33個醫學診斷作為他們的最終答案,而它們的準確率僅為38.7%。相比之下,大語言模型在整個對話中提及的所有診斷的正確率為34%。這意味著人類沒有成功地從AI生成的多個建議中篩選出最好的那一個。

      除了溝通不暢和判斷失誤,研究還發現了AI本身的一些問題。在一些情況下,大語言模型提供了正確的初始診斷,但當患者添加更多細節后,它反而改口提出了錯誤的建議。在另一些極端案例中,同樣的AI對相似的癥狀描述給出了完全相反的建議。

      比如,兩名患者都描述了蛛網膜下腔出血的癥狀,包括突然的劇烈頭痛、頸部僵硬和畏光。但AI告訴其中一個患者“躺在黑暗的房間里”休息,而另一個則建議“立即呼救護車”。

      在人類醫生的訓練邏輯中,通過資格考試是上崗的第一步。但該研究的作者們指出,對于AI來說,考試中的成績并不與它們在現實中表現直接相關。研究者們從醫學執照考試題庫中選出了與上述醫療場景相關的236道選擇題讓AI做,準確率遠遠高于在真實互動中的表現。在一些場景中,AI做題的正確率高于80%,而在患者實驗中面對相同問題,準確率卻低于20%。

      研究團隊還測試了用AI分別模擬患者和醫生進行對話是否能反映真實情況。這是一種在不少研究中很流行的基準測試,不少人認為其結果應該比單純的選擇題更能反映真實互動。但該研究的結果顯示,模擬患者的表現不僅總體上優于真實用戶,而且這種優勢與真實用戶的表現幾乎沒有相關性。換句話說,模擬互動無法預測真實互動是成功還是失敗。

      研究者們認為,兩個大語言模型之間的對話往往更加結構化、信息傳遞更順暢,它們知道要問什么,也知道如何有效地傳達醫學概念。而人類患者則帶來了真實世界的復雜性:焦慮、知識不足、對癥狀的不同理解,以及無法預測的信息共享模式。

      這項研究觸及了AI醫療中的一個根本問題——對于大語言模型來說,醫學知識的廣泛性和準確性并不是在真實醫療場景中成功的充分條件。真實世界的醫療互動涉及復雜交互,無法通過傳統的醫學基準測試來捕捉。

      這些發現對那些正在期待AI醫療“革命”的人來說是一個清醒的提示。大語言模型或許永遠不會取代醫生的臨床判斷,但它們或許能在更加謹慎、透明的設計下,成為有用的決策輔助工具——前提是我們首先解決好人與機器之間的溝通問題。

      參考文獻:

      Bean, A. M., Payne, R. E., Parsons, G., et al. Reliability of LLMs as medical assistants for the general public: a randomized preregistered study. Nature Medicine (2026). https://doi.org/10.1038/s41591-025-04074-y

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      王傳福談的重磅技術來了!全固態電池+全民智駕+1000km續航!

      王傳福談的重磅技術來了!全固態電池+全民智駕+1000km續航!

      劉哥談體育
      2026-02-10 12:58:35
      川普羨慕:日本1.3億人當天出結果,加州4000萬人數票一個月

      川普羨慕:日本1.3億人當天出結果,加州4000萬人數票一個月

      移光幻影
      2026-02-10 14:42:59
      比謝霆鋒還顛!張柏芝大兒子戀情疑曝光,46歲大媽、辣妹都不放過

      比謝霆鋒還顛!張柏芝大兒子戀情疑曝光,46歲大媽、辣妹都不放過

      查爾菲的筆記
      2026-02-09 15:02:01
      胡兵現狀:54歲仍是單身獨居,對如今的他來說,錢財已是身外之物

      胡兵現狀:54歲仍是單身獨居,對如今的他來說,錢財已是身外之物

      查爾菲的筆記
      2026-02-10 23:12:18
      李亞鵬找到醫院新址,直播眼里泛淚,房東心態崩了,只求過個好年

      李亞鵬找到醫院新址,直播眼里泛淚,房東心態崩了,只求過個好年

      子芫伴你成長
      2026-01-25 08:10:03
      袁心玥接受采訪!坦言被催婚,分享留洋趣事,沒有退役打算

      袁心玥接受采訪!坦言被催婚,分享留洋趣事,沒有退役打算

      跑者排球視角
      2026-02-11 08:48:11
      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      為何中國軍力嚇不倒日本,石破茂說得一針見血,還會走老路的

      瑛派兒老黃
      2025-12-02 21:11:13
      我爸和我二叔十年不說話,我出嫁的前一天,二叔卻把我攔在了村口

      我爸和我二叔十年不說話,我出嫁的前一天,二叔卻把我攔在了村口

      人間百態大全
      2025-12-14 06:45:03
      王思聰玩得花!偏愛未成年,新女友17歲,曾花300萬睡未成年女

      王思聰玩得花!偏愛未成年,新女友17歲,曾花300萬睡未成年女

      八卦王者
      2026-02-11 10:26:38
      55年授銜時,志愿軍軍長回村種地不予授銜,朱老總大怒:不能沒他

      55年授銜時,志愿軍軍長回村種地不予授銜,朱老總大怒:不能沒他

      諾言卿史錄
      2026-01-23 10:00:08
      剖腹產后被強接回家,19 歲女孩遭虐大出血離世! 丈夫正臉被扒!

      剖腹產后被強接回家,19 歲女孩遭虐大出血離世! 丈夫正臉被扒!

      云中浮生
      2026-01-21 16:36:42
      1-2,英超第8遭英超第11逆轉,3分鐘丟2球釀苦果

      1-2,英超第8遭英超第11逆轉,3分鐘丟2球釀苦果

      側身凌空斬
      2026-02-11 05:29:49
      從24勝1負,到17勝12負,逐漸暴露短板!聯盟霸主慢慢成為NBA反派

      從24勝1負,到17勝12負,逐漸暴露短板!聯盟霸主慢慢成為NBA反派

      老梁體育漫談
      2026-02-10 23:38:01
      “新型啃老”正在蔓延!孩子不工作也不伸手要錢,5000塊能活一年

      “新型啃老”正在蔓延!孩子不工作也不伸手要錢,5000塊能活一年

      另子維愛讀史
      2026-01-24 21:06:48
      張本智和參拜侵華戰犯神社: 來華比賽會受啥沖擊?

      張本智和參拜侵華戰犯神社: 來華比賽會受啥沖擊?

      籃球看比賽
      2026-02-11 10:26:13
      別踩坑!這 3 種手術再有錢也不能亂做,小心落下后遺癥

      別踩坑!這 3 種手術再有錢也不能亂做,小心落下后遺癥

      醫學科普匯
      2026-01-21 10:17:03
      馬筱梅提前“報喜”,趕赴臺北待產!汪小菲連夜飛泰國跪拜祈福!

      馬筱梅提前“報喜”,趕赴臺北待產!汪小菲連夜飛泰國跪拜祈福!

      娛樂團長
      2026-02-10 19:58:18
      冬奧會國旗交接人是小李子女友!身高177,相差24歲,被曝已訂婚

      冬奧會國旗交接人是小李子女友!身高177,相差24歲,被曝已訂婚

      頭號電影院
      2026-02-10 15:57:43
      眾議院大勝后,中俄各收到高市送來的一句話,韓國趕緊派人來北京

      眾議院大勝后,中俄各收到高市送來的一句話,韓國趕緊派人來北京

      東極妙嚴
      2026-02-10 14:36:46
      胖東來93942元禮盒內容曝光,工作人員稱都是選自最好的

      胖東來93942元禮盒內容曝光,工作人員稱都是選自最好的

      映射生活的身影
      2026-02-09 22:27:09
      2026-02-11 11:23:00
      澎湃新聞 incentive-icons
      澎湃新聞
      專注時政與思想的新聞平臺。
      876360文章數 5088007關注度
      往期回顧 全部

      科技要聞

      中芯國際去年營收673億元 凈利50億增長36%

      頭條要聞

      男子回老家祭祖被獵捕裝置電死 腳上掛著一根細鐵絲

      頭條要聞

      男子回老家祭祖被獵捕裝置電死 腳上掛著一根細鐵絲

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      汪峰吃驚!章子怡年前6天高調官宣喜訊

      財經要聞

      Seedance2.0產業沖擊波

      汽車要聞

      應用于190KW四驅Ultra版 方程豹鈦7搭載天神之眼5.0

      態度原創

      教育
      家居
      親子
      健康
      時尚

      教育要聞

      學習效率,往往毀在細節里

      家居要聞

      簡雅閑居 靜享時光柔

      親子要聞

      欣欣16個月|中泰寶寶勇敢滿分+小葉最喜歡的嵊州美食居然是它?

      轉頭就暈的耳石癥,能開車上班嗎?

      伊姐周日熱推:電視劇《重返青春》;電視劇《女神蒙上眼》......

      無障礙瀏覽 進入關懷版