我下載過兩個舌診APP。
操作都差不多:拍一張舌頭照片,等幾秒,出來一份報告。"體質偏寒""脾胃虛弱""建議調理"。有的還配了食療方案,紅豆薏米水、姜茶之類。
![]()
第一次看完覺得有點意思。用了幾次之后,我開始懷疑。
宣傳98%,實際呢
某舌診系統的官網寫著準確率98%。另一份臨床研究,11000次樣本,準確率87.3%。
差了十個百分點。
原因不難理解。實驗室里的測試環境是標準光源、固定角度、專業拍攝。你在家里用手機拍,可能開著臺燈,可能背對窗戶,可能剛喝完一杯深色飲料。這些變量都會影響圖像質量,進而影響判斷結果。
安徽中醫藥大學附屬醫院做過對照研究,AI輔助舌診確實能提升診斷效率。但他們反復強調一個詞:輔助。
AI給參考,醫生做決定。這兩件事不是一個級別。
它在看什么
說白了就是深度學習。喂進去幾萬張帶標簽的舌頭圖片,模型學會識別顏色、紋理和某些特征跟疾病之間的統計關聯。
新照片進來,它去翻訓練數據里最像的那幾張,輸出一個概率最高的結論。
這個邏輯在理想條件下跑得不錯。問題是現實不理想。
手機拍照的光照太不可控了。同一個舌頭,白天客廳拍的和晚上臥室拍的,RGB值差一大截。算法對光照敏感度很高,這點誤差傳導到診斷結果上,可能直接改變結論。
數據集也有局限。如果訓練樣本主要來自某個地區、某個年齡段、某類飲食習慣的人群,換一群人用,準確率就會掉。目前公開的數據集規模都不大,覆蓋面有限。
更關鍵的一點:舌象只是中醫四診里的"望"。聞(聽聲音)、問(癥狀)、切(脈象),這三個維度APP完全拿不到。光憑一張圖做診斷,信息量本身就不夠。
我試出來的問題
我用同一張舌頭照片,在同一天上午,分別上傳給三個不同APP。
結果出來了:一個說"濕熱體質",一個說"脾虛夾濕",一個說"大致正常,注意保暖"。
![]()
同一張圖,三種說法。
當然,醫生之間也會有分歧。但醫生的分歧建立在望聞問切綜合判斷的基礎上,APP的分歧建立在單張圖片的不同算法權重上。前者有臨床經驗兜底,后者只有統計學概率。
還有一個事讓我不太舒服。注冊這類APP的時候,基本都要授權相機權限,有些還要填年齡、性別、體重甚至月經周期。這些健康數據存在哪、會不會被拿去做別的用途,用戶協議寫得模模糊糊。
我沒法確認它們有沒有違規,但我確定自己不知道答案。
我的看法
AI面診不是騙局。它在特定場景下確實有用——比如作為初步篩查工具,或者幫助沒條件及時就醫的人做個參考。
但它離"看病"這件事的距離,比宣傳的要遠得多。
我奶奶有次胃不舒服,讓我幫她在手機上看一下。我拍了她的舌苔傳上去,APP說"脾胃虛寒,建議溫補"。后來去醫院做了個胃鏡,慢性淺表性胃炎伴幽門螺桿菌感染。醫生開的方案跟APP的建議完全不一樣。
這不是說APP完全不準。是說它能看到的東西太少,漏掉的東西太多。
拿來當個參考可以。拿來當決策依據,風險自負。
你敢把健康交給AI嗎?歡迎在評論區聊聊
#AI面診#科技養生#醫療AI#健康焦慮#數據準確性
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.