一位女士連續十年體檢結果都顯示正常,卻突然被確診為晚期癌癥。這事兒最近刷屏了——原來體檢報告上的“一切正常”,有時候還真不一定能揪出那些潛藏的壞細胞。
《自然·醫學》雜志上近期刊登的一項中國研究發現:AI可能是個神助攻!科學家們訓練了一個AI,只靠普通的平掃CT,居然成功識別出了早期胃癌!
![]()
而且,在此之前,他們在胰腺癌上也進行了成功的驗證。抱著強烈的好奇心,我最近去了阿里達摩院,與論文一作、AI圖像識別專家夏英達博士深度暢聊,看他和團隊如何把AI煉出“火眼金睛”,將日常CT檢查變成癌癥早篩工具,而且,這技術已經在醫院用上啦!
![]()
夏英達
阿里巴巴達摩院
醫療AI實驗室算法工程師
文字內容摘自本期播客,完整音頻見文末
特別感謝音頻剪輯伙伴:沒事喵一個
菠蘿:最開始想到用平掃CT做癌癥篩查是誰的想法?
夏英達:這個項目源于我們合作的曹醫生的經歷。這是一個有點悲傷的故事,他的一位老師五十多歲時因胰腺癌去世。曹醫生后來查看老師兩年前的胸部CT平掃片子時,憑借經驗發現那時已有胰腺癌的跡象。
常規胸部CT平掃主要用于檢查肺部結節等問題,但也會掃到部分胰腺。經驗豐富的醫生在知道患者后來得了胰腺癌的前提下,回顧性仔細查看這些CT片,是有可能發現早期跡象的。因此,曹醫生想到,能否利用這些日常體檢中產生、但通常不用來看胰腺的平掃CT數據,借助AI早期發現胰腺癌。
但實現這個想法很困難:人眼在平掃CT上識別早期胰腺病變本身就很難;目前也沒有相關的臨床規范;醫生缺乏這方面的培訓;我們也沒有前期研究或經驗支持。胰腺癌發病率低,篩查工具精度必須非常高,假陽性太多會帶來巨大負擔,失去篩查意義。所以最初的嘗試完全是偶然的。
但初步結果意外發現,AI識別的準確率相當高,這里面當然有運氣成分,很多科學研究的突破,多多少少都有點好運加持。
我在博士期間也做了很多一線影像的工作,當時我所在的霍普金斯醫學院有一位合作的世界知名放射專家,我們也請教過他的觀點,當時他給出的意見是“Don't think about it”,也就是說平掃CT來看胰腺癌完全不可能,這符合醫生的普遍認知和我們早期實驗的觀察——即使在PET-CT上,人眼識別早期胰腺癌也很困難。
但是嘗試性的成功試驗給了我們很大的信心,決定深入研究。從想法到初步實驗很快,只用了幾個月。但從初步結果到嚴謹驗證則耗時很長:需要提升算法精度;醫學數據收集困難,實驗設計復雜;整個詳細驗證過程花了1到2年。完成這些后,我們才將研究投稿。
菠蘿:所以我很好奇,你們給AI喂了多少片子和數據,才能有這么高的精度?
夏英達:其實是一家一線城市醫院連續幾年的數據和病。因為胰腺癌還是相對比較罕見的,我們用了大幾千個腫瘤數據,在這個領域算是數據體量比較大的。大部分胰腺癌是沒法手術的,而我們只用了可以手術的病例,希望能發現早期的可手術的胰腺癌,發現之后有辦法進行處理,如果很晚期的胰腺癌其實提示意義也不大了。
菠蘿:你們是把可以手術的胰腺癌患者的平掃CT片子喂給了AI,然后讓它來研究一下有什么特點嗎?
夏英達:從科普的角度就是這個意思。但平掃CT其實分辨率相對較低。給AI去看它也是一頭霧水,不知道看什么東西。所以要想進一步提高精度,就需要一些其他的模型設計。
一個關鍵的設計是利用增強CT。我們收集了配對的平掃CT和增強CT數據,拿到這個數據后,醫生在知道患者確診胰腺癌的前提下,可以在增強CT上比較準確地勾畫出胰腺腫瘤的位置、形狀和邊界。然后,我們再反過頭來,通過圖像配準技術,將增強CT上醫生標注的精確腫瘤信息(位置、形狀等)對應到同一次檢查的平掃CT圖像上。這樣,AI在分析平掃CT時,就能明確知道需要關注的目標區域和特征,也就是有了挖掘的目標,從而更有效地學習到相關的特征,那它就知道要“看”什么了。
還有一個很有趣的現象,CT圖像具有很寬的色彩分辨率(例如從-1024到1024或更高),并且是連續的灰度圖像,這個是高于人眼的。人眼對灰度差異的分辨能力有限,但對于AI而言,處理的是數字本身,不受這種限制。因此,AI可能比人眼更能捕捉到平掃CT中細微的數值變化和模式,我們推測這可能是AI在該任務上表現更好的原因。
菠蘿:所以未來的目標就是,在不知道這個人有沒有得胰腺癌的情況下,通過CT判斷是否有相關風險。未來會應用到別的腫瘤嗎?
夏英達:我們現在也應用到了胃癌,思路是類似的,也是先由醫生在增強CT上去畫,然后再反過來對應平掃CT。我們希望這套思路能夠應用在更多的腫瘤病種,目前也在逐步驗證中,經過嚴謹的驗證之后再進發布。因為癌癥是很復雜的疾病,各個癌種一個一個解決,其實會更嚴謹。
菠蘿:在做胃這種器官的時候,和胰腺會有區別嗎?
夏英達:有一個根本性的區別,胰腺是實性臟器(腺體),其腫瘤在CT圖像上相對更容易觀察,一個實性腫瘤生長在實性器官上,對比度相對明顯。而空腔臟器(如胃、食管、腸道)則不同,其內部是空的,腫瘤往往生長在內壁上。這給我們帶來了巨大挑戰。與臨床醫生交流時,他們也會認為在空腔臟器上用CT檢測腫瘤是更不可能完成的任務。通常情況下,胃癌、腸癌、食管癌的發現和確診通常依賴內鏡檢查和活檢,強調“眼見為實”。
因此,我們未來的工作其實可能會在這個問題上有重大突破——我們發現這套技術方案在空腔臟器上也具有可行性!這意味著其潛力可以拓展到更多空腔器官。尤其在中國,胃病受到高度重視且極為常見。如果能在消化道腫瘤(如胃癌)上驗證我們技術的有效性,其實是非常有意義的事情。
當然,我們也希望探索其他腫瘤類型,但在實際操作中面臨很多困難。在相同數據規模和技術方案下,胃癌篩查的性能遠低于胰腺癌;其實也體現了消化道腫瘤的檢測難度確實遠高于實性臟器。
機緣巧合下,我們與浙江省腫瘤醫院達成了合作。對方給予了我們極大的支持,我們兩個團隊緊密協作。尤其幸運的是,醫院程書記本人正是胃癌領域的權威專家,他的參與給了我們很大的信心。作為科研工作者,我們渴望挑戰那些“不可能”的任務,因為這樣的成果才更具影響力。正是通過這種深度的緊密合作,我們逐漸達成目標,最終在胃癌篩查上也達到了令人滿意的精度水平。
菠蘿:說到CT這事兒,因為CT是有輻射的,那我們能不能把這個技術用在別的影像上,比如核磁?
夏英達:同樣的技術方案在核磁上理論上是可以嘗試的,但是我們為什么選擇CT?首先CT的量是最大的,尤其是新冠幾年,拍了很多的肺部影像,而且現在CT的劑量是越做越低的。現在大家去做體檢都是做的低劑量CT,帶來的輻射幾乎對人體沒有影響。另一方面,核磁現在最大的問題其實就是慢,又慢又貴,經濟負擔會大一些。其實不同的影像在AI眼里都差不多,都是數據的統計和歸納。
菠蘿:現在這個東西是在研究層面,還是已經布局到醫院了?
夏英達:已經落地了,我們在多家醫院都已經實際部署了相關AI工具。比如最新的胃癌篩查模型,現在已經在浙江省腫瘤醫院全量使用了。這意味著,醫院里任何科室、出于任何目的進行的CT檢查,其圖像都會自動經過該模型分析,實現機會性的癌癥風險篩查。該工具也將很快推廣至更多醫院,開展前瞻性的臨床試驗。
從臨床角度看,該工具的核心作用是提示風險。當模型判定結果為陽性(高風險)時,醫生會進行復核。若醫生也認為情況可疑,便會主動聯系患者,告知其胃癌或胰腺癌高危風險,并建議其接受進一步檢查。如果患者同意,則通過后續檢查明確診斷,這其實是一個比較好的發現早期癌癥的路徑。
我們必須保證模型的特異性很高,因為如果特異性低了,假陽性率就會特別高,假如特異性90%,聽起來已經很高了,但是如果做一個10萬人的篩查,將產生1萬人的假陽性,醫生需要復查海量的結果,對社會、醫院和個人都是很大的負擔。因此,模型實際應用時必須確保其特異性極高,假陽性率極低——我們的目標是將特異性嚴格控制在99%以上。
菠蘿:在醫院里運行這套流程有挑戰嗎?會有人不相信嗎?
夏英達:確實 很難,畢竟這些患者本身就不是來做胃部檢查的,可能是感冒或者哪兒疼,隨便拍了一個CT,過兩天接到電話被告知有胃癌的風險,那第一反應肯定是詐騙,這是非常正常的想法。所以現在一個最大的問題就是患者的依從性不佳,召回率較低。
我們一直在努力提高AI工具的準確率,也希望大家一旦被提示高危,能多聽醫囑,因為這并不是單獨由AI給出的結論,而是AI輔助下,經驗豐富的醫生給出的判斷,是相對準確的。這項服務也沒有收費,就是希望能夠盡可能發現更多的早期癌癥,挽救更多人的生命,因為早期和晚期的治療結果真的差別很大。
菠蘿:有沒有讓你印象特別深的案例?讓你覺得這件事真正幫到人了?
夏英達:有一個患者讓我感觸很深。她是一位很年輕的女性,父母是聾啞人。開始因為咳嗽做了胸部CT,AI提示胰腺癌陽性,經過醫生的確診,就想把她召回復診。但是總是無法說服她,她一直說如果去做手術,父母就沒人照顧了。即使這樣,醫生也沒有放棄,堅持不懈地提醒她,要是不及時檢查,后面可能更沒法照顧父母。這位醫生的精神也非常令人感動,真的就是純粹地想救人。最后,正是因為醫生的不斷提醒,患者在其他醫院做了手術,發現真的是極早期的胰腺癌,治療后基本不影響壽命,其實這是非常罕見的事情。
菠蘿:發現極早期胰腺癌真的很難,因為沒有任何癥狀。是不是也要掃好多好多CT才能發現一兩個這種案例?
夏英達:是的,我們的技術已累計應用于十幾萬例的篩查。令人鼓舞的是,其中約50% 被發現的胰腺癌病例處于早期、可手術階段。尤為關鍵的是,這些發現均是在患者尚無任何胰腺相關癥狀的常規檢查中實現的。這就證明,利用該工具對無癥狀人群進行篩查,確實具備在早期階段識別出胰腺癌并爭取治愈機會的潛力。正如前面提到的病例,不僅能幫助患者,更是由此挽救一個家庭。
菠蘿:現在還有很多的其它篩查工具,包括液體活檢、無創篩查等,咱們這種技術在哪些方面會有比較好的優勢呢?
夏英達:首先,基于影像的篩查是相對客觀的——如果影像已經有表現了,其實有沒有腫瘤是比較明確的。另一方面,液體活檢肯定是非常有價值的,也是最近非常火的方向和趨勢,未來應該是各種方式相輔相成。
癌癥的檢出絕不可能依賴單一方法。無論是當前熱門的液體活檢,還是我們探索的基于CT的機會性篩查,都在向覆蓋多癌種的方向發展。未來,整合多種檢測方式、多種篩查策略,將有效推動癌癥診斷窗口前移,使更多癌癥在更早期階段得以確診——這無疑是降低癌癥死亡率的最有效途徑。
菠蘿:所以基于胃癌也好,或者胰腺癌,你們下一步的計劃是什么呢?
夏英達:我們首先是想把這個事情做到底,除了單點突破,還要去把前瞻性臨床試驗驗證做好。所謂前瞻性,就是將我們的軟件實際部署到醫院等臨床環境中,通過收集和分析數據,切實評估未來能否提升早期診斷率并最終改善患者生存預后。
與此同時,拓展篩查癌種也是我們重要的努力方向。目前,針對食管癌、結直腸癌、肝癌等癌種的篩查模型也正處于驗證階段。我們最終的目標,是開發一個泛癌種篩查工具,也就是就是用一個CT把所有的癌癥都篩查了。
菠蘿:從AI應用到臨床上來說,你個人比較看好的幾個方向是什么?
夏英達:其實AI能在醫療上做的事情是非常多的,我們只是集中在了其中一個非常小的子領域。想象一下,當患者進入醫院,最基礎的需求之一就是精準導診——現在利用大語言模型來優化分診流程的應用已經非常多了。
菠蘿:我聽過一個笑話,就是有人乳腺上長了一個包,他去到胸外科,結果被告知胸外科不是看胸外的事情,是看胸內的事情——胸外科是看肺部的……所以確實像你說的,大多數人的直覺不一定在醫院能夠匹配上真正應該去的地方。
夏英達:導診僅是開端。從診療全流程看,核心環節包括:篩查、診斷、治療、預后。我們現在開發的工具是做篩查,側重于患者入院前的風險提示。而診斷環節則是明確問題所在的,AI在此階段也大有可為,比如輔助內鏡檢查、病理判讀,甚至通過整合患者癥狀描述、臨床指標等,通過大語言模型,結合多模態的AI進行綜合診斷,這都是AI極具價值的方向。最近就有一個AI大模型成功診斷罕見病例的新聞,其表現超越了眾多醫生。畢竟AI模型都是通過大量的知識去進行歸納總結,有些病可能醫生一輩子都見不到一例,但是AI見過不少。
預后同樣關鍵。比如對于某位患者,AI能輔助預測:選擇治療方案A或B,可能的生存期、治療費用等預后信息,為醫患決策提供重要參考,這其實也是一個很有價值的事情。
還有一些其他的方向,比如手術機器人其實也與AI相關。再有就是AI輔助類工具,比如在保險方面,用AI來幫助你快速報銷,和保險公司算賬等等。所以我覺得在整個醫療的方方面面,AI都會產生深刻的影響,這一天到底何時到來,我們還未可知。
菠蘿:你剛才講到整個流程,我覺得還有一個特別重要的事,就是治療后的隨訪。尤其像腫瘤患者,放化療后可能面臨長期副作用(如心臟毒性)。但治療結束后,患者往往缺乏系統指導,不清楚除了腫瘤復查,還需定期檢查相關器官(如心臟)以保障長期生活質量。AI在此類主動提示和健康管理方面,效率會非常高。
AI還有什么別的非醫學的應用場景嗎?
夏英達:AI其實可以做很多事情。只要有需求就有市場,在各行各業都會有一些影響。比如在醫美行業,如果讓整形醫生通過經驗來做設計,可能會按照某個明星的樣子給你做,如果讓AI基于你個人特征來設計,雖然不像女明星,卻可能更符合個性化審美。
牙科領域,尤其是正畸治療規劃,同樣大量融入了AI技術。也是同樣的道理,按照自己的長相做一個操作步驟少,既符合審美、又保留個人特點的方案。
菠蘿:作為一個AI專家,你覺得以后AI真的會顯著比人類更厲害嗎?
夏英達:這個其實我是相信的。現在已經印證了,AI在各個行業都超過人的歸納能力。因為數據見得太多了,他不一定超越最厲害的專家,但是超越一個平均水平的工作者是沒有問題的。
AI甚至有望作出創新性的科學發現,人類科技的進步,歷來是非常聰明的人在推著歷史車輪往前走。那么,是否有一天,AI也能通過其強大的推理能力,獨立做出新的科學突破?這是非常值得期待的一件事情,也是非常可怕的一件事情。
我以前是非常鄙視AI危險論的。在AI有之前其實就有講述AI如何危險的電影,但作為早期的AI研究者,那個時候我所認識的AI做一些非常普通的任務還做不明白,怎么可能超越人類呢?甚至大模型剛出來的時候,我也是非常鄙視這種危險論的,認為也只是一個歸納模型。但是現在大模型的推理能力越來越強,甚至能解決一些非常難的數學問題,這需要很強的推理和邏輯能力,所以我現在也逐漸有點相信這個AI危險論了。至于未來究竟會怎樣,讓我們拭目以待。
—聽夏英達博士聊更多關于AI篩查—
/本期志愿者/
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.