![]()
機(jī)器之心發(fā)布
通用大模型(LLM)的狂飆突進(jìn),終于在醫(yī)療垂直領(lǐng)域的「最后一公里」撞上了硬墻。雖然 ChatGPT 在 USMLE(美國(guó)執(zhí)業(yè)醫(yī)師資格考試)中表現(xiàn)優(yōu)異,但在面對(duì)需要「火眼金睛」和「毫厘必爭(zhēng)」的心臟手術(shù)臺(tái)上,通用大模型的表現(xiàn)究竟如何?
近日,一項(xiàng)由空軍軍醫(yī)大學(xué)唐都醫(yī)院李妍教授團(tuán)隊(duì)牽頭,與深圳清華大學(xué)研究院朱銳團(tuán)隊(duì)聯(lián)合完成的 COMPARE 研究在 arXivs 上發(fā)表預(yù)印版。研究揭示:在經(jīng)皮冠狀動(dòng)脈介入治療(PCI)的決策制定中,CA-GPT垂直領(lǐng)域 CA-GPT 系統(tǒng)(一項(xiàng)基于 OCT 影像的 AI 系統(tǒng)),在關(guān)鍵決策指標(biāo)上顯著優(yōu)于 Open AI 的通用大模型 ChatGPT-5。該研究是基于中科微光醫(yī)療(Vivolight Medtech)OCT 系統(tǒng)搭建的 RAG 增強(qiáng)型 AI-OCT 整合決策支持模型。
![]()
- 論文標(biāo)題:COMPARE: Clinical Optimization with Modular Planning and Assessment via RAG-Enhanced AI-OCT: Superior Decision Support for Percutaneous Coronary Intervention Compared to ChatGPT-5 and Junior Operators
- 論文地址:https://arxiv.org/abs/2512.10702
這不僅是一次算法的勝利,某種程度上可以稱得上是中國(guó)腔內(nèi)影像領(lǐng)域的「DeepSeek 時(shí)刻」。這套 CA-GPT 系統(tǒng)有望重新定義心臟介入手術(shù)的智能化標(biāo)準(zhǔn)。
01. 巔峰對(duì)決
通用大模型在專業(yè)戰(zhàn)場(chǎng)「水土不服」
據(jù)《2023 年全球心血管疾病負(fù)擔(dān)報(bào)告》統(tǒng)計(jì),每年因心血管疾病死亡的人數(shù)達(dá) 1920 萬,而經(jīng)皮冠狀動(dòng)脈介入治療(PCI)作為最核心的血運(yùn)重建手術(shù),全球年手術(shù)量已超過 400 萬例。在 PCI 手術(shù)中,OCT(光學(xué)相干斷層成像)被稱為醫(yī)生的「第三只眼」,可清晰看到血管內(nèi)病變情況,但是其圖像解讀高度依賴醫(yī)生經(jīng)驗(yàn),初級(jí)醫(yī)師與資深專家在手術(shù)成功率、并發(fā)癥發(fā)生率等關(guān)鍵指標(biāo)上的差距高達(dá) 40% 以上。
![]()
腔內(nèi)影像中不同技術(shù)與分辨率的對(duì)比示意圖
在這項(xiàng)納入了 96 名患者、160 處病變的臨床研究中,團(tuán)隊(duì)構(gòu)建了一個(gè)嚴(yán)苛的競(jìng)技場(chǎng):將 CA-GPT 系統(tǒng)、ChatGPT-5 以及擁有 1-5 年經(jīng)驗(yàn)的初級(jí)介入醫(yī)師放在同一維度下,以資深專家團(tuán)隊(duì)制定的手術(shù)記錄為金標(biāo)準(zhǔn)進(jìn)行盲測(cè) 。所有方案均與患者實(shí)際接受的手術(shù)記錄(由年手術(shù)量≥ 200 例、經(jīng)驗(yàn)≥ 10 年的高級(jí)專家完成)進(jìn)行比對(duì)。評(píng)估涵蓋 10 項(xiàng)預(yù)設(shè)決策指標(biāo),分為術(shù)前規(guī)劃 5 項(xiàng)和術(shù)后評(píng)估 5 項(xiàng),每項(xiàng)一致得 1 分,總分 0-5 分。
![]()
10 項(xiàng)不同 PCI 策略的評(píng)分標(biāo)準(zhǔn)
值得一提的是,傳統(tǒng) OCT 圖像解讀還需要醫(yī)師逐幀分析,耗時(shí)數(shù)分鐘至十?dāng)?shù)分鐘。相比之下,CA-GPT 系統(tǒng)可在 20 秒內(nèi)完成全面分析并生成結(jié)構(gòu)化報(bào)告,將影像解讀時(shí)間縮短 95% 以上。
結(jié)果顯示,在術(shù)前規(guī)劃(Pre-PCI)階段,CA-GPTChatGPT形成了「降維打擊」:
- 總體決策評(píng)分:CA-GPT 系統(tǒng)的評(píng)分中位數(shù)達(dá)到滿分 5.0,顯著高于 ChatGPT-5 的 3.0(P<0.001),同時(shí)也優(yōu)于初級(jí)醫(yī)師的 4.0。
- 支架直徑選擇(關(guān)鍵指標(biāo)):CA-GPT 的準(zhǔn)確率高達(dá)90.3%,而 ChatGPT-5 僅為 63.9%,甚至低于初級(jí)醫(yī)生的 72.2%。
- 支架長(zhǎng)度選擇:CA-GPT 準(zhǔn)確率達(dá)80.6%,ChatGPT-5 僅為 54.2%。
![]()
決策一致性亞組分析
![]()
各評(píng)分項(xiàng)目的性能分布
而在術(shù)后評(píng)估(Post-PCI)階段,三方總體表現(xiàn)都比術(shù)前更好,因?yàn)檫@個(gè)階段有了術(shù)前方案和實(shí)際結(jié)果可以參考。但 CA-GPT 依然在一些關(guān)鍵指標(biāo)上表現(xiàn)出優(yōu)勢(shì),比如:對(duì)「最小支架面積是否達(dá)標(biāo)」的判斷,CA-GPT 與專家判斷的吻合度接近 100%;年輕醫(yī)生略有差距。
對(duì)「支架是否擴(kuò)張不足」、「是否存在嚴(yán)重貼壁不良」的識(shí)別,CA-GPT 在支架貼壁評(píng)估(93.2% 準(zhǔn)確率)等需要精細(xì)判斷的項(xiàng)目上,優(yōu)于初級(jí)醫(yī)師組(76.1%)。
那為何擁有海量參數(shù)的 ChatGPT-5 會(huì)敗下陣來?研究指出,通用大模型雖然語言推理能力強(qiáng),但缺乏對(duì)圖像數(shù)據(jù)的數(shù)值敏感性和空間理解力。特別是在面對(duì)功能性缺血(OCT-FFR≤0.80)或嚴(yán)重鈣化等復(fù)雜病變時(shí),通用模型容易產(chǎn)生「幻覺」,而 CA-GPT 則展現(xiàn)了極高的穩(wěn)定性,在復(fù)雜病變亞組分析中依然保持了中位數(shù) 5.0 的高分。
02. 解密架構(gòu)
RAG + DeepSeek 的工程化勝利
CA-GPT 之所以能實(shí)現(xiàn)高穩(wěn)定性和準(zhǔn)確性,核心在于摒棄了對(duì)單一端到端大模型的迷信,構(gòu)建了一套嚴(yán)密的「小模型 + 大數(shù)據(jù) + 大模型」的 RAG 復(fù)合智能體架構(gòu)。
![]()
CA-GPT 訓(xùn)練模型架構(gòu):小模型 + 大數(shù)據(jù) + 大模型
據(jù)其技術(shù)披露,該系統(tǒng)并非簡(jiǎn)單的聊天機(jī)器人,而是一個(gè)精密的協(xié)作系統(tǒng):
- 「感官」精準(zhǔn)化(小模型層):系統(tǒng)底層集成了13 項(xiàng)核心功能(含 6 項(xiàng)自研專有算法)。它們負(fù)責(zé)像「顯微鏡」一樣對(duì) OCT 影像進(jìn)行結(jié)構(gòu)化分析,在5-10 秒內(nèi)即可完成管腔分割、斑塊定性、鈣化積分計(jì)算等定量工作,為決策提供精準(zhǔn)的數(shù)據(jù)地基。
- 「大腦」邏輯化(DeepSeek):在大模型推理層,該系統(tǒng)基于開源的DeepSeek構(gòu)建。它不再依賴概率生成文本,而是基于小模型提供的精準(zhǔn)量化數(shù)據(jù),進(jìn)行符合醫(yī)學(xué)邏輯的深度推理。
- 「知識(shí)」實(shí)時(shí)化(RAG 技術(shù)):通過檢索增強(qiáng)生成(RAG)技術(shù),系統(tǒng)鏈接了包含超過 100 萬篇心血管文獻(xiàn)及指南的知識(shí)庫(kù)(DBdata)。這意味著,AI 的每一次決策建議,都能追溯到具體的專家共識(shí)或最新指南,有效抑制了 AI 幻覺。
![]()
基于 CA-GPT 的 AI-OCT 系統(tǒng)輔助決策案例介紹
03. 普惠價(jià)值
讓縣域醫(yī)生擁有「頂級(jí)三甲專家」視野
這項(xiàng)技術(shù)突破的終極意義,不在于在論文中戰(zhàn)勝 ChatGPT,而在于解決醫(yī)療資源分布不均的現(xiàn)實(shí)痛點(diǎn)。全球心血管疾病負(fù)擔(dān)日益加重,但資深介入專家(完成 1000+ 例手術(shù))卻是極度稀缺資源。培養(yǎng)一名能獨(dú)立處理復(fù)雜病變的醫(yī)生,往往需要 8-12 年的漫長(zhǎng)周期。研究數(shù)據(jù)顯示,初級(jí)醫(yī)生在處理復(fù)雜病變時(shí),與專家存在顯著差距。
因此,CA-GPT 系統(tǒng)在本質(zhì)上是在做「醫(yī)療能力的平權(quán)」
想象一下,在偏遠(yuǎn)的縣級(jí)醫(yī)院,一位剛工作不久的醫(yī)生,在面對(duì)復(fù)雜的鈣化病變時(shí)手足無措。此時(shí),CA-GPT 系統(tǒng)在 5-10 秒內(nèi)給出了手術(shù)策略:
- 「建議預(yù)處理使用旋磨術(shù),旋磨頭選擇 1.5mm」
- 「建議支架尺寸 3.0 x 28mm,釋放壓力 12atm」
- 「注意:遠(yuǎn)端存在邊緣夾層風(fēng)險(xiǎn)」
這相當(dāng)于每臺(tái)手術(shù)都有一位頂尖專家在旁「手把手」指導(dǎo)。
04. 結(jié)語
做垂直領(lǐng)域的「定義者」
過去十年,中國(guó)醫(yī)療器械行業(yè)更多是在追趕西方的腳步。但此次發(fā)布的 CA-GPT 系統(tǒng)及其臨床成果,標(biāo)志著中國(guó)企業(yè)在高端腔內(nèi)影像領(lǐng)域開始掌握定義權(quán)。
不做通用大模型的「套殼」,而是深耕垂直場(chǎng)景的「窄門」。 用數(shù)據(jù)證明:在醫(yī)療這種容錯(cuò)率為零的領(lǐng)域,唯有將深度學(xué)習(xí)的精準(zhǔn)度與大模型的推理能力完美結(jié)合,才是 AI 落地的正途。
這或許就是中國(guó)醫(yī)療科技的「DeepSeek 時(shí)刻」—— 把 AI 技術(shù)落地業(yè)務(wù)場(chǎng)景,用自己的技術(shù),解決最真實(shí)的臨床痛點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.