![]()
作者|Hayward
原創首發|藍字計劃
無聊的時候用AI聊聊天、要改文章風格的時候用AI偷下懶、需要配圖的時候讓AI畫一個…
但如果我說AI能救命,閣下又該如何應對呢?
8月2日,微博CEO @來去之間發微博昨天睡前突然感覺到強烈的頭暈目眩,直接暈到走不動道,甚至都“站不起來”了。他家里人幫他量了血壓,發現高壓還不到90,妥妥的低血壓。
低血壓這件事可大可小,如果發展到極端情況,會陷入休克,甚至會引發腦梗和心梗,是會死人的。不過能干上微博CEO的還是藝高人膽大,他沒有第一時間打車去醫院,反而選擇了先問AI。
他在把癥狀夸大之后,又把自己晚上吃喝過的東西通通發給AI,最終“診斷結果”是因為喝了隔夜的VC泡騰水,得了「反射性低血壓」。
最終,在AI的建議下,他就喝了點可樂、蒙脫石散和補液鹽,一小時后還真好了。
![]()
這事一出,立馬刷新了很多人的對AI的認知,原來AI除了幫我們偷懶和娛樂外,還能用來“問診”。
但從網友們的反應來看,更多人的態度還是“不買賬”。不僅來去之間的評論區里有不少人批評這個例子會誤導網友在緊急時不去找醫生找AI,耽誤最佳治療時間,還有一些網友認為來去之間這個行為,是面對生命健康的兒戲。
網友們的質疑完全可以理解。如果是一個月前的我,肯定也會和大多數網友一樣罵一聲來去之間“不知死活”。
但恰好在兩周前,我女朋友正是用AI解決了一個困擾她二十多年的疑難雜癥,再加上來去之間這次的案例,讓我更加相信“AI問診” 這件事,可能遠比大家想的靠譜。
賽博神醫
都說年紀大機器壞,隨著年齡越來越大,大家肯定多多少少都有一些存在很多年,雖不致命但又沒法完全根治的病癥。
比如我女朋友,她自七歲起就有一個怪病,發病時會先伴隨強烈的眼花、目眩,就像套上了萬花筒一樣,過了半小時之后就開始頭暈,一暈就得四五個小時。
這個怪病發作的時候視線模糊得什么都看不了,頭暈之后又只能躺在床上休息,二十多年都是這樣過來的。雖然說不會危及生命,但對日常的生活工作有非常大的影響。
更令人心煩的是,這二十多年里看過了無數三甲醫院、診所、偏方,有說是急性腸胃炎的、耳源性眩暈的,去看了中醫又說是肩頸部供血不足…診斷結果五花八門,但始終沒有一個醫生、一種藥能解決這個問題,甚至緩解發作的癥狀。
所以,正當我們束手無策的時候,抱著死馬當活馬醫的心態,不如問一下ChatGPT 4o吧,或許它會知道一些什么。
不得不說,真是不試不知道,一試嚇一跳:我們輸入女朋友的過往的疾病史、生活史、過往診斷、用藥及效果之后,ChatGPT給出了一個完全意料之外的診斷結果:前驅性偏頭痛。
![]()
對于這個診斷結果,它是這樣解釋的:“視覺異常+隨后頭暈惡心嘔吐+睡眠緩解+發作性+月經周期相關的癥狀,高度符合偏頭痛伴先兆(Migraine with aura)的臨床表現。”
而且ChatGPT好像猜到了我們會對“偏頭痛”這個結果感到意外,特地解釋了一番:“許多偏頭痛患者并不以“頭痛”為主,而可能以眩暈為主癥狀”,同時解釋了之前醫生會誤判的可能因素。
![]()
ChatGPT在整理出答案之后,還會給我們推薦掛號的醫院科室,強調了要找眩暈相關的醫生;并且在回答的最后,主動詢問我們需不需要準備病情的自述提綱,或者生成病癥判斷的邏輯文檔。
![]()
可以看到,ChatGPT的整個診斷流程里,分析有理有據、引經據典,并且回答的情商非常高,不僅有對患者的安慰、對過去醫生的找補,還能積極引導我們為看病做好準備。
只是,這個診斷結果是不是真的正確呢?除了GPT,我們也用同樣的提示詞問了谷歌Gemini 2.5 Pro,來交叉驗證一下。
對于這個病癥,Gemini給出了類似的答案。雖然它稱之為“前庭性偏頭痛(Vestibular Migraine)”,但結合后續回答對癥狀、病史的分析,說的的確是同一個病。
基本可以確定,這個怪病是“偏頭痛”了。
![]()
另外在體驗兩款AI工具的時候我們也發現,Gemini的回答會顯得更加簡潔高效,整個文本的排版看起來更有重點更加舒服,只用來查詢病癥的話顯然用Gemini更加方便。
但如果想更加深入了解具體情況,ChatGPT的擬人化程度真的很高,交互起來就更加友好。比起Gemini在回答結尾的“打雞血”,好像答完這個問題就下班了,還是GPT的循循善誘,甚至主動提議幫你準備一些能用得上的材料,更加溫暖貼心。
![]()
最后,為了驗證兩個AI的診斷結果是不是準確的,我們拿著GPT生成的看病材料到了廣州某個三甲醫院的神經內科,并根據它的推薦找了眩暈相關的醫生。
令我們十分意外的是,門診的醫生,無論是對GPT的診斷還是它制作的就診信息匯總表都高度肯定,他說GPT的診斷結果基本是準確的。
不過因為女朋友癥狀發作的時候從來沒有出現過明顯的頭痛,醫生也認為這是一個罕見病,同時的確也很容易誤診。
最終醫生給出的診斷是“基底型偏頭痛”,是對偏頭痛病癥的一種細分類型。
![]()
然而,更絕的還在后面。針對這個罕見病,醫生給女朋友開了一個還在臨床試驗的特效藥,而這個特效藥是真的有用。
在后面女朋友這個病再次發作的時候,把這個特效藥吃下去之后,平時需要幾個小時才能緩解的眼花、頭暈,不到半個小時就能大幅度緩解,已經不影響正常的生活工作了。
![]()
所以,在這次親身經歷里,無論是前期的AI輔助診斷,還是后期醫生的對癥下藥,都對找到這罕見病的治療方法發揮了巨大作用。
我們不禁會想:如果早幾年就能用上現在這個版本的ChatGPT 4o,會不會更早幾年就能免受這個罕見病帶來的痛苦?
而且GPT在AI問診的過程中,還可以協同幫助我們梳理發病經過、組織描述病歷的語言大綱;在我們不確定該怎么描述一些癥狀時,AI 還可以引導我們去準確地描述出來,甚至還可以幫我們自動生成一些類似自測量表的文書工具。
從靠譜程度來說,比“百度搜病癥”不知道有用到哪里去了。
另外,經過這次事件之后,我也是查了資料才知道,原來AI在醫療領域回答的靠譜程度,原來是遠高于其他領域的。
“神醫”的底氣
一向都喜歡胡編亂造的AI,怎么在問診這件事上突然就靠譜起來了?
從宏觀層面來說,醫療信息的高度結構化、知識密度大且更新速度快,恰好正是大模型擅長處理的內容。
響應迅速的大模型可以7x24小時處理大規模醫學知識、精準匹配用戶問題,并可以通過數據訓練在任意時間不斷學習和更新,還可以像上面提到的在咨詢、問診的過程中輔助醫生決策與診斷。
所以,能力越強的大模型,越適合用來回答醫療相關的問題。除了上面提到的ChatGPT 4o和谷歌Gemini 2.5 Pro,國內一些能力出色的大模型在醫療領域的表現也很不錯。
就在今年6月,斯坦福大學發布了一項有關臨床醫療AI模型的全面評測,顯示DeepSeek R1以66%的勝率和0.75的宏觀平均分,在九個前沿大模型中脫穎而出,成為全球冠軍。
另外,阿里旗下的AI產品最近也在高調地進軍醫療市場。除了最近廣告打得飛起的夸克高調宣布“已經將健康大模型集成在AI搜索框中”外,同門兄弟的“螞蟻AQ”也是一款專注C端健康管家的軟件。
但強大的模型能力只是一切的基礎。對醫療領域的回答來說,訓練數據是不是足夠準確、可靠,重要性遠超其他領域。所以,使用高質量、結構化的醫學數據進行訓練是必須的。
在這方面,ChatGPT說他們微調數據來自臨床指南、UpToDate、PubMed的數據,并且會專門過濾非結構化網絡信息,避免患者論壇誤導性內容,保證醫療回答的信息可靠、專業。
另外,Gemini這邊的數據依托Google Health的真實病例與結構化EHR(Electronic Health Record,電子健康檔案)數據,并且會有醫生團隊篩選訓練語料,避免AI胡編亂造。
無論是哪家的大模型,醫療相關的數據來源必須是經過層層篩選,可不是什么“隨便網上找來的”就能用來喂給大模型的。
有了高質量數據之后,要怎么用?這時就會用上訓練大模型過程中的“知識增強”(Retrieval-Augmented Generation, RAG),在模型生成回答前,先進行知識檢索,再由模型生成答案,確保輸出內容與權威資料一致。
不同模型的具體做法可能會不太相同,比如ChatGPT會在聯網模式中,借助Bing +醫學數據庫內容實時增強;Gemini會動態連接Google Search醫療知識面板,引用臨床試驗、指南等摘要內容等等。
除此之外,大模型還會內置“醫療事實校驗模塊”(Fact Consistency Checker),在回答生成后,會反向再判斷一次輸出是否與數據庫一致。
例如,輸出回答后,會抽取模型回答中的關鍵實體(如疾病名、藥品名),看這些東西是不是知識庫里存在的;又例如,會對輸出進行“自動三段論”邏輯審查,檢查“疾病類型→感染類型→藥物適應癥”這三者之間是否合理配套。
因為這一步能夠顯著減少因錯誤推理鏈導致的醫學性幻覺,無論是通用大模型,比如ChatGPT、Gemini、Anthropic Claude,還是醫療垂直大模型,比如夸克醫療大模型、訊飛星火醫療大模型和平安醫療認知大模型,都已標配。
最后部分大模型輸出的結果,還會通過專業醫生反饋標注,并在多輪標注之后用于強化學習,并設計一套完善的準確性獎勵機制等等…
簡而言之,AI 醫療問答場景下的回答,需要經過一系列“防幻覺系統工程”的處理,相比傳統的問答流程更加復雜、嚴謹和專業,所以醫療場景下的 AI 回答才會比其他情況更有可信度。
“吃錯藥會死人”的道理大家都懂,在這種嚴肅領域,AI大模型廠商更怕出事擔責。
黎明前夜
財經故事薈提供了一組數據,在美國頂級醫療機構中,高達87%的科室已實現AI工具的常態化使用(每周>50次),其中放射科、病理科的采納率更是達到了95%。
另外,美國、英國、法國、瑞士等國家都有在試點,將AI工具引進醫生的日常工作流中,為患者解答問題、分析醫學影像和自動生成臨床文書等,為探索AI工具在臨床醫學流程的實際運用提供了寶貴數據。
AI醫療的確是一個非常有想象力的領域,看病難、醫療資源不均衡的問題全世界都存在,但AI的出現,對普通人來說意味著多了一份可以隨身攜帶專業的醫療知識寶典,對醫生來說也是一個非常強大的減負工具。
雖然現在誰也不敢拍胸口保證 AI 問診的結果是百分百準確,但也不妨試試使用ChatGPT、Gemini等工具幫你總結一下病情發展的經過、描述一下癥狀和病情,并幫你將這些信息整理到表格里,至少能幫你提高看病時和醫生溝通的效率,還不怕擔心遺漏重要信息點。
這不比用AI來算命有價值多了?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.