![]()
氨基觀察-數(shù)字醫(yī)療組原創(chuàng)出品
作者 | 林白
很多人可能沒有意識到,放眼全球,醫(yī)療是 AI 滲透速度最快的核心行業(yè)之一。
根據(jù) Menlo Ventures 的最新研究,2023 年全球醫(yī)療機(jī)構(gòu)的 AI 采用率僅為 3%,但到 2025 年,這一數(shù)字已飆升至 22%。短短兩年,增長超過 7 倍。
然而,當(dāng)大洋彼岸的醫(yī)療 AI 加速狂飆,患者開始習(xí)慣 AI 輔助,甚至超過 45% 的美國醫(yī)生已經(jīng)高頻使用 OpenEvidence 輔助決策時,國內(nèi)的圖景卻呈現(xiàn)出一種微妙的“錯位”。
一方面,超過1000家醫(yī)院開始使用AI系統(tǒng),國家醫(yī)療AI專項投入數(shù)百億元,在持續(xù)探索如何把AI應(yīng)用到醫(yī)療行業(yè)。另一方面,面對復(fù)雜的臨床決策,醫(yī)生不敢輕易將信任交付給一個偶爾會“胡說八道”的黑盒。
這一困境的本質(zhì),是市面上始終缺乏一個真正成熟、嚴(yán)謹(jǐn)、且可托付的醫(yī)療大模型底座。幸運(yùn)的是,這個長期困擾行業(yè)的“信任死結(jié)”,正在被解開。
近期,百川智能正式發(fā)布了面向醫(yī)療應(yīng)用開發(fā)者的 Baichuan-M3 Plus。
與上一代 M3 相比,M3 Plus 不再僅僅追求通用能力的提升,而是將觸角伸向了真實醫(yī)療場景最痛的地方——如何讓模型變得足夠可靠,并具備規(guī)模化落地的經(jīng)濟(jì)性。
如果說之前的醫(yī)療 AI 還是“嘗鮮品”,那么 M3 Plus 的發(fā)布,或許真正有望打通國內(nèi)醫(yī)療 AI 落地的“最后一公里”。
它是如何做到的?我們一起來看看。
AI醫(yī)療的“最后一公里”——信任
在所有垂直 AI 賽道中,醫(yī)療已經(jīng)成為資金最密集、確定性最高的方向之一。
2025 年,全球醫(yī)療 AI 的年度支出達(dá)到 14 億美元,幾乎是 2024 年的三倍。這一數(shù)據(jù)也標(biāo)志著一個歷史性時刻:醫(yī)療首次超越法律、金融、設(shè)計,成為 AI 垂直領(lǐng)域中資金最密集的賽道。
僅在 AI 醫(yī)療領(lǐng)域,已經(jīng)跑出了 8 家 AI 獨(dú)角獸,數(shù)量明顯高于其他垂直行業(yè)。其中表現(xiàn)最突出的,當(dāng)屬 OpenEvidence。
不到兩年時間內(nèi),其月度醫(yī)生咨詢量從 2024 年的 36 萬次,增長到 2025 年的850 萬次,增長超過20 倍。
把視角拉回國內(nèi),AI在醫(yī)療場景加速落地的趨勢同樣存在。
比如,新華社在 2025 年 2 月的一篇報道中提到,國內(nèi)已有超過 1000 家醫(yī)院提供大模型相關(guān)的醫(yī)療服務(wù)和智能應(yīng)用,醫(yī)院可以基于不同大模型底座,開發(fā) AI 助手、健康知識問答等功能。
雖然宏觀層面在大力推進(jìn),但落回到微觀層面,也暴露出了一些不足。
比如,大部分醫(yī)生并不知道如何使用AI。一個很明顯的例子是,許多醫(yī)生已經(jīng)在私下使用 AI 做資料檢索和輔助分析。但一旦涉及到正式的臨床系統(tǒng),態(tài)度立刻變得謹(jǐn)慎。
中國醫(yī)生正面臨的一個現(xiàn)實的挑戰(zhàn):市面上缺乏一個真正成熟、可托付的醫(yī)療大模型。
事實上,這一問題并非國內(nèi)獨(dú)有。
今年年初,國外投資機(jī)構(gòu)Bessemer Venture Partners聯(lián)合Amazon Web Services與 Bain & Company,對醫(yī)療行業(yè) 400 多家公司進(jìn)行了一次系統(tǒng)調(diào)研,試圖回答一個問題:AI 為什么在醫(yī)療落地會卡住?
結(jié)論指向四個核心障礙:安全問題、缺乏內(nèi)部 AI 專業(yè)能力、成本高企,以及數(shù)據(jù)準(zhǔn)備的挑戰(zhàn)。如果進(jìn)一步抽象,會發(fā)現(xiàn)除數(shù)據(jù)問題外,其余障礙幾乎都可以歸結(jié)為兩個命題:
AI 是否足夠可靠,以及是否具備可接受的經(jīng)濟(jì)性。
在醫(yī)療場景中,這兩點(diǎn)不是錦上添花,而是能否使用的前提,尤其是前者。
這也揭示了AI在醫(yī)療場景落地的特殊性,與其他AI產(chǎn)品更側(cè)重于“能力展示”不同,AI醫(yī)療應(yīng)用更追求“可信交付”。而這恰恰也給了創(chuàng)業(yè)公司巨大的機(jī)會。
死磕“幻覺”與“有證可循”,
百川正在定義醫(yī)療AI的新范式
百川選擇的方向,恰恰是在模型層面系統(tǒng)性解決這一問題。
在上周開源發(fā)布了 Baichuan-M3后,這次百川進(jìn)一步推出了面向醫(yī)療應(yīng)用開發(fā)者的 M3 Plus。
![]()
與 M3 相比,M3 Plus進(jìn)一步探索了模型在真實醫(yī)療場景中,變得足夠可靠、并具備規(guī)模化落地的可能性。
要理解 M3 Plus 的意義,需要回到百川更早的技術(shù)選擇。
在去年的 Baichuan-M2 Plus 中,百川首次將「六源循證」這一循證醫(yī)學(xué)范式系統(tǒng)性引入模型訓(xùn)練與推理過程。與其說,這是一個簡單的知識庫,不如說是一套圍繞醫(yī)學(xué)證據(jù)構(gòu)建的結(jié)構(gòu)化認(rèn)知體系。
這套體系覆蓋從原始研究、證據(jù)綜述、指南規(guī)范,到臨床實踐、公共健康教育以及監(jiān)管與真實世界數(shù)據(jù)等多個層級。模型在訓(xùn)練和推理過程中,被明確約束只能使用權(quán)威醫(yī)學(xué)來源,而非互聯(lián)網(wǎng)泛化信息,并且需要在不同證據(jù)層級之間建立清晰映射。
這種設(shè)計的直接結(jié)果,是模型真正學(xué)會了如何基于證據(jù)給出判斷。在這一機(jī)制下,模型的醫(yī)學(xué)幻覺顯著下降,可信度開始逼近資深臨床醫(yī)生的決策風(fēng)格。
在 M3 中,百川進(jìn)一步把幻覺控制前移到模型基座層面,探索更底層的解決路徑,團(tuán)隊構(gòu)建了一套事實感知強(qiáng)化學(xué)習(xí)(Fact-Aware RL)架構(gòu)。
所謂的Fact-Aware RL ,簡單來說,就是在模型訓(xùn)練的每一次獎懲中,都加入對醫(yī)學(xué)事實的嚴(yán)苛校驗。這相當(dāng)于在 AI 的大腦里植入了一個實時的「審稿人」。當(dāng)模型試圖為了讓答案看起來通順而編造一個藥物劑量時,懲罰機(jī)制會立刻介入。
這樣一來,使底座模型在無工具的設(shè)定下幻覺也能大幅降低到SOTA水平。
而 M3 Plus,正是將這兩條技術(shù)路線合并的結(jié)果:一方面,繼承 M3 的低幻覺模型基座;另一方面,在此之上系統(tǒng)性強(qiáng)化循證推理能力。
![]()
在六源循證體系的約束下,模型的事實性幻覺進(jìn)一步下降,開始具備在真實醫(yī)療應(yīng)用中“可托付”的基礎(chǔ)。
當(dāng)然,在醫(yī)療場景中,僅僅“少說錯話”還不夠。與面向大眾健康助手不同,一個AI產(chǎn)品終究能否被醫(yī)生信任,往往取決于另一件事:引用是否準(zhǔn)確。
原因很簡單,在醫(yī)療場景里,所有決策都要求有引用,因為醫(yī)療決策本身就是一個以證據(jù)為核心的責(zé)任體系。
雖然說引用很重要,但在引用準(zhǔn)確性這一關(guān)鍵問題上,始終缺乏系統(tǒng)性的優(yōu)化路徑。現(xiàn)實中,醫(yī)療大模型的引用錯誤非常常見,部分市場主流模型產(chǎn)出的結(jié)果里,單個問題的引用錯誤率甚至能超過90%。看似非常專業(yè),引用了許多權(quán)威協(xié)會的專家共識、原則性的官方文件,下面還有一些說明書之類的東西。
但要么“張冠李戴”,看似有引用編號,但文獻(xiàn)內(nèi)容并不支持當(dāng)前表述;要么“內(nèi)容沖突”,角標(biāo)形式正確,但模型并未真正理解證據(jù)立場,只是機(jī)械拼接。
這種引用不準(zhǔn)確的問題,在醫(yī)療場景中變得尤為可怕,但卻始終未引發(fā)足夠的重視。
問題的根源在于,很多模型只是把“是否給出引用”當(dāng)作生成約束,卻從未把“引用是否正確”作為一個可以學(xué)習(xí)、可以懲罰的核心目標(biāo)。
在 M3 Plus 中,百川選擇正面解決這一問題,將引用準(zhǔn)確性作為獨(dú)立的訓(xùn)練目標(biāo)進(jìn)行系統(tǒng)建模:
一是引入專門的 Citation Reward Model,對引用行為本身進(jìn)行學(xué)習(xí);
二是對多類引用錯誤進(jìn)行明確懲罰,包括編號存在但內(nèi)容不匹配、描述與原文證據(jù)不一致、以及關(guān)鍵證據(jù)漏召回;
三是將引用正確性與六源循證體系、答案正確性深度耦合,使引用不再是生成完成后的“裝飾”,而是貫穿檢索、理解與生成全過程的結(jié)構(gòu)性約束。
在這一訓(xùn)練機(jī)制下,模型被迫只在“能夠被證據(jù)支持”的空間內(nèi)進(jìn)行推理。最終,結(jié)論與證據(jù)段落的匹配準(zhǔn)確率超過 95%,真正讓 AI 的醫(yī)學(xué)判斷做到可核驗、可追責(zé)、可教學(xué)。
![]()
總的來說,M3 Plus 所做的事情,并不是再一次能力堆疊,而是試圖在模型層面回答一個更根本的問題:如何讓AI的每一次輸出,都有據(jù)可查、可信可用。
用成本優(yōu)勢,
砸開了醫(yī)療 AI 的天花板
當(dāng)然,醫(yī)療大模型要真正進(jìn)入真實世界,僅僅做到“效果可靠”還不夠,成本同樣是決定能否規(guī)模化落地的硬約束。
在現(xiàn)實部署中,醫(yī)療機(jī)構(gòu)和商業(yè)應(yīng)用面對的,并不只是“模型是否足夠強(qiáng)”的問題,更直接的挑戰(zhàn)在于:最先進(jìn)模型的調(diào)用成本,是否允許它被高頻、長期、穩(wěn)定地使用。如果每一次推理都意味著顯著的邊際成本,再好的能力也只能停留在試點(diǎn)階段。
正是基于這一判斷,在 M3 Plus 中,百川圍繞醫(yī)學(xué)場景,對模型架構(gòu)、推理路徑與部署形態(tài)進(jìn)行了系統(tǒng)性的工程重構(gòu),在不犧牲模型可靠性與醫(yī)學(xué)能力的前提下,將綜合使用成本壓縮至上一代的約 30%,為真實規(guī)模化使用打開空間。
正是在這一基礎(chǔ)上,百川在經(jīng)濟(jì)性約束上完成了關(guān)鍵突破,具備被更廣泛使用的現(xiàn)實條件。
目前,百川不僅面向開發(fā)者開放 API 的限時免費(fèi)體驗,更發(fā)起 「海納百川」計劃:面向所有服務(wù)醫(yī)務(wù)工作者的機(jī)構(gòu),免費(fèi)提供全球幻覺最低循證增強(qiáng)醫(yī)療大模型 M3 Plus 的 API,把服務(wù)醫(yī)生的AI能力直接交到生態(tài)伙伴手里。
當(dāng)可靠性與經(jīng)濟(jì)性同時被突破,AI 才第一次具備在醫(yī)療體系中持續(xù)運(yùn)行、規(guī)模化部署的可能性。也只有在這一刻,醫(yī)療 AI 的天花板,才真正開始被打開。
從市場規(guī)模看,這是一塊足夠大的“長期戰(zhàn)場”。根據(jù)公開數(shù)據(jù),中國醫(yī)療衛(wèi)生總費(fèi)用已超過 8 萬億元人民幣,占 GDP 的比重接近 8%,直接和間接從業(yè)人員規(guī)模達(dá) 千萬人以上。無論從支出體量還是社會影響力來看,醫(yī)療都是典型的“國民級行業(yè)”。
與以往醫(yī)療信息化項目不同,本輪 AI 在醫(yī)療行業(yè)的落地,呈現(xiàn)出明顯的非線性加速特征。根據(jù)Menlo Ventures 的報告,醫(yī)療系統(tǒng)的傳統(tǒng) IT 采購周期,已從 8.0 個月縮短至 6.6 個月;門診服務(wù)提供商的采購周期,也從 6.0 個月降至 4.7 個月。
AI滲透加速的原因也很好理解,醫(yī)療行業(yè)本身存在大量剛性需求,使 AI 更容易擊中“非可選項”。
舉個例子,就拿醫(yī)生需求來說,醫(yī)學(xué)知識的爆炸式增長,讓臨床信息處理本身變得不可持續(xù)。
現(xiàn)在,醫(yī)學(xué)知識平均每 5 年更新一次,文獻(xiàn)以每兩分鐘一篇的速度增加。在這樣的背景下,醫(yī)生需要在極短時間內(nèi)完成大量信息篩選與判斷,而傳統(tǒng)檢索工具已難以勝任。
也正是在這一現(xiàn)實背景下,百川的布局顯現(xiàn)出更深層的意義。
/ 04 /
總結(jié)
過去幾年,大模型領(lǐng)域反復(fù)上演著同一種敘事:Demo 足夠驚艷,但真正落地卻異常艱難。能力的提升,并沒有自然轉(zhuǎn)化為可持續(xù)的應(yīng)用。
百川所體現(xiàn)出的,是一種在行業(yè)中并不常見的清醒判斷。在醫(yī)療這個萬億級的國民行業(yè)里,技術(shù)是否“最強(qiáng)”并不是首要問題,“用得起”和“信得過”同樣重要,甚至更重要。
通過 Gated Eagle-3 投機(jī)解碼和面向醫(yī)學(xué) MoE 的量化重構(gòu),百川解決的并不只是算力成本的問題,而是 AI 是否具備進(jìn)入真實醫(yī)療流程的“入場條件”。
在醫(yī)學(xué)知識以分鐘級速度膨脹的當(dāng)下,醫(yī)生個體的認(rèn)知與處理能力已接近極限。如何在不增加醫(yī)生負(fù)擔(dān)、不引入額外風(fēng)險的前提下,擴(kuò)展醫(yī)學(xué)決策的能力邊界,正在成為整個體系必須回答的問題。一個不知疲倦、成本可控、且具備嚴(yán)格循證約束的 AI,更像是一種基礎(chǔ)能力的延伸,而非簡單的工具替代。
從這個角度看,百川所構(gòu)建的,并不只是一個模型或一套 API,而是在嘗試為智能醫(yī)療建立一層可被長期依賴的技術(shù)底座。
![]()
在這場關(guān)乎生命與健康的變革中,百川正試圖證明:最好的科技,不是為了取代醫(yī)生,而是為了讓醫(yī)生回歸治愈的本質(zhì),讓醫(yī)療回歸服務(wù)的初心。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.