
作者 | 褚杏娟
在“大模型六小虎”成為歷史后,王小川終于等來了自己的風(fēng)口。
近日,國內(nèi)外大廠在醫(yī)療領(lǐng)域動(dòng)作頻繁。1 月 8 日,OpenAI 高調(diào)入局,除了推出 ChatGPT Health,還收購了醫(yī)療保健初創(chuàng)公司 Torch。幾乎同期,Anthropic、英偉達(dá)、蘋果等都有產(chǎn)品和合作發(fā)布。國內(nèi),螞蟻阿福自發(fā)布后短期內(nèi)月活用戶突破 3000 萬,單日提問量超千萬。資本市場上,AI 醫(yī)療板塊逆勢走強(qiáng),成為最近市場熱點(diǎn)。
在此前大模型競爭激烈的當(dāng)口,AI 醫(yī)療并不是一個(gè)很性感的話題。那種不信任來自百川內(nèi)外。
2023 年成立的百川在一年后戰(zhàn)略收縮,決定聚焦醫(yī)療,成為國內(nèi)較早專注到醫(yī)療的大模型創(chuàng)企。但內(nèi)部“沒有足夠傳達(dá)在醫(yī)療上的決心和路徑要求,沒有讓每個(gè)團(tuán)隊(duì)在醫(yī)療價(jià)值創(chuàng)造中深度思考 why 和 how,進(jìn)而導(dǎo)致部分團(tuán)隊(duì)工作目標(biāo)出現(xiàn)了搖擺和偏差。”“去年中途轉(zhuǎn)過來時(shí)被罵慘了。”
不只內(nèi)部,業(yè)界對 AI 醫(yī)療也存有疑慮,連帶著對百川的路線選擇也有質(zhì)疑。“2024 年跟醫(yī)生談 AI,大家都不信。”王小川直言。
直到 2025 年,大家看到 DeepSeek 真的比百度靠譜很多;年末阿福發(fā)布,投了 10 億來砸廣告,看到了技術(shù)和應(yīng)用進(jìn)展;今年 1 月 8 日,OpenAI Health 正式上線,Anthropic 也發(fā)布了自己的兩個(gè)技術(shù)能力:醫(yī)療計(jì)算和 Agent,兩個(gè)巨頭都開始進(jìn)入醫(yī)療。
“所以,從市場判斷來看,醫(yī)療作為 AI‘皇冠上的明珠’這樣的高級(jí)階段,已經(jīng)開始進(jìn)入應(yīng)用范疇。”王小川說道。
![]()
從發(fā)布反思信至今 9 個(gè)月過去,王小川向 InfoQ 表示,百川如今的護(hù)城河主要有三個(gè):一是模型結(jié)構(gòu)的優(yōu)先級(jí),“醫(yī)療安全性”和“診斷準(zhǔn)確性”始終是首位;二是切入點(diǎn)選擇,百川聚焦嚴(yán)肅、高價(jià)的醫(yī)療場景,區(qū)別于其他企業(yè)的健康類打法,這類場景的壁壘更高,且有明確的付費(fèi)意愿;三是產(chǎn)品形態(tài)的差異化,百川身份差異化服務(wù)和決策輔助能力,是現(xiàn)有產(chǎn)品不具備的。
王小川尤其提到,大廠和創(chuàng)業(yè)公司不一樣,他們有職業(yè)團(tuán)隊(duì),需要的是更安穩(wěn)的方案。“大創(chuàng)新靠小廠,小創(chuàng)新靠大廠,必須切入我們認(rèn)為有高價(jià)值的事情,共識(shí)不是我們優(yōu)先的突破點(diǎn),而大廠更多的是注重共識(shí),路線圖和產(chǎn)品形態(tài)是不一樣的。”
1 模型要低幻覺、能問診,多模態(tài)非主戰(zhàn)場
“去年 8 月發(fā)布的 M2 作為百川重新聚焦醫(yī)療之后的主力模型,在行業(yè)得到很多好評(píng)。典型現(xiàn)象就是螞蟻開始瘋狂挖人,從技術(shù)人員到財(cái)務(wù)人員,所以屬于小圈子認(rèn)可技術(shù)路線圖。”王小川說道。
昨天,百川正式開源了新一代醫(yī)療大模型 Baichuan-M3。據(jù)百川智能模型技術(shù)負(fù)責(zé)人鞠強(qiáng)介紹,Baichuan 系列采用 SCAN 框架,實(shí)現(xiàn)臨床醫(yī)生層級(jí)的推理與問診。其核心在于不僅詢問疾病類型,更通過定量問題將模糊主訴轉(zhuǎn)化為可定位、可量化的臨床證據(jù);并且突破單一癥狀的局限,進(jìn)行跨系統(tǒng)關(guān)聯(lián)推理。
其次,團(tuán)隊(duì)高度重視并主動(dòng)防控大模型在醫(yī)療中的“幻覺”,堅(jiān)持正確知識(shí)并進(jìn)行原子級(jí)事實(shí)檢驗(yàn):在模型推理過程中進(jìn)行逐層事實(shí)核查,確保結(jié)論基于真實(shí)輸入。
鞠強(qiáng)介紹,在模型訓(xùn)練中,抑制“幻覺”與提升推理能力之間存在明顯的“蹺蹺板效應(yīng)”,容易陷入兩種極端:若過度追求推理表現(xiàn),其生成內(nèi)容會(huì)更豐富、答對率上升,但幻覺也難以控制;若強(qiáng)力抑制幻覺,模型則會(huì)趨向過度保守,回答變得拘謹(jǐn)甚至回避問題,導(dǎo)致實(shí)用性下降。這也是團(tuán)隊(duì)在 Baichuan-M3 訓(xùn)練中重點(diǎn)攻克的問題。
為破解這一矛盾,研發(fā)團(tuán)隊(duì)引入了 Fact-aware 強(qiáng)化學(xué)習(xí)技術(shù)。該技術(shù)核心在于,在強(qiáng)化訓(xùn)練過程中,既對幻覺進(jìn)行充分壓制,又確保推理能力不受損,反而同步提升。
結(jié)果顯示,相比前代模型 M2,百川正式開源新一代醫(yī)療大模型 Baichuan-M3 的幻覺率大幅下降,同時(shí)在醫(yī)療專業(yè)評(píng)測 HealthBench 上的推理能力得分從 34 分顯著提升至 44 分,位列榜首。在不依賴工具或檢索增強(qiáng)的純模型設(shè)置下,醫(yī)療幻覺率 3.5,超越 GPT-5.2。“這驗(yàn)證了我們通過強(qiáng)化學(xué)習(xí)方法,在抑制幻覺與增強(qiáng)推理之間取得了有效平衡。”鞠強(qiáng)表示。
![]()
Hugging Face 地址:https://huggingface.co/baichuan-inc/Baichuan-M3-235B
GitHub 地址:https://github.com/baichuan-inc/Baichuan-M3-235B
另外,模型深度集成的問診能力,從日常癥狀中識(shí)別風(fēng)險(xiǎn)。團(tuán)隊(duì)設(shè)計(jì)了防御性思維追問,以甄別背后潛在的系統(tǒng)性疾病,還會(huì)進(jìn)行組合癥狀敏銳識(shí)別,比如用戶描述“情緒激動(dòng)時(shí)左牙疼”時(shí),模型能會(huì)關(guān)聯(lián)“牙痛 + 情緒癥狀”,優(yōu)先建議排查心臟系統(tǒng)問題,從而排除重大隱患,而非直接推薦牙醫(yī)或止痛藥。該能力已集成至產(chǎn)品,服務(wù)于醫(yī)生與普通用戶。
在 AI 醫(yī)療中,除了文字,還有影像等信息。不過,王小川認(rèn)為,多模態(tài)并非當(dāng)前 AI 主戰(zhàn)場。
他解釋道,ChatGPT 之所以令人震撼,正是因?yàn)樗宫F(xiàn)出一種“智力”,而智力的本質(zhì),是將具體事物進(jìn)行抽象的能力,其核心在于符號(hào)系統(tǒng)。在這一邏輯下,智能主要依托于三種形式語言:自然語言、數(shù)學(xué)語言與代碼語言。至今,評(píng)估一個(gè)模型能力的強(qiáng)弱,本質(zhì)上仍是檢驗(yàn)其符號(hào)處理與邏輯推理的水平,功能可用并不等同于智力高超。在醫(yī)療領(lǐng)域,這一觀點(diǎn)尤為關(guān)鍵。醫(yī)療的核心是決策,而不僅僅是感知。
實(shí)際上,未來醫(yī)學(xué)影像的初步解讀可由專用小模型完成,許多廠商也已具備相應(yīng)的圖像引擎。但真正的價(jià)值在于:將影像符號(hào)化之后,如何用語言模型進(jìn)行綜合推理與判斷。因此,感知模型與認(rèn)知模型必須結(jié)合。
他認(rèn)為,當(dāng)前的一些工作,比如將 CT 影像轉(zhuǎn)化為報(bào)告,或是專注于胰腺癌篩查的視覺模型,固然有其價(jià)值,但它們更像是“掛在智力之樹上的葉子”,是整體流程中的一環(huán),而非驅(qū)動(dòng)智能演進(jìn)的主戰(zhàn)場。真正的突破,仍在于如何通過符號(hào)與語言,構(gòu)建能夠進(jìn)行復(fù)雜醫(yī)療決策的認(rèn)知核心。
2 “在中國 To C 比 To B 更好”
“未來巨大的增量是在院外,不在院內(nèi)。”王小川說道。其核心是直接服務(wù)患者,而不是通過服務(wù)醫(yī)生間接服務(wù)患者。
反觀 OpenAI 的入局是靠打造“個(gè)人超級(jí)助手”,Anthropic 則從合規(guī)性與臨床效率上做 B 端突圍。對此,王小川的評(píng)價(jià)是:“美國是 To C 和 To B 都可以干,但在中國 To C 比 To B 更好。”
王小川認(rèn)為,國內(nèi)的醫(yī)療現(xiàn)狀是醫(yī)生供給不足,互聯(lián)網(wǎng)雖能連接信息卻無法創(chuàng)造供給;醫(yī)患權(quán)力不均,雙方容易溝通不暢、患者無助;患者更傾向三甲醫(yī)院,致使基層醫(yī)療薄弱;醫(yī)療知識(shí)分散于各科室,復(fù)雜病癥往往缺乏整體視角。
基于此,他的設(shè)想是 AI 可以“造出高質(zhì)量醫(yī)生”,但不是要 AI 取代醫(yī)生。“在某些維度上,AI 超過醫(yī)生是必然的,比如信息收集的完整性、醫(yī)學(xué)知識(shí)的儲(chǔ)備量、循證的精準(zhǔn)度等。但 AI 不會(huì)取代醫(yī)生的核心執(zhí)行能力,比如手術(shù)、查體等。”
在不取代醫(yī)生的情況下,AI 可以推動(dòng)“權(quán)力讓渡”,即幫助患者理解病情與方案,獲得更多參與權(quán)和知情權(quán)。另外,居家通過 AI 進(jìn)行初步咨詢,讓“居家首診”可能,減輕醫(yī)療系統(tǒng)負(fù)擔(dān)。此外,復(fù)雜問題需要跨科室會(huì)診,以前就是入院即入組,即進(jìn)入某個(gè)科研隊(duì)列,有了 AI 后能夠做到“看病即入組”,更有機(jī)會(huì)做好生命模型。
在實(shí)現(xiàn)的產(chǎn)品形態(tài)上,百川目前主打還是百小應(yīng) App,不過用戶進(jìn)入后可以選擇醫(yī)生和患者兩種身份,給出的結(jié)果是不一樣的:醫(yī)生版更像 OpenEvidence,答案更加專業(yè)、更加強(qiáng)調(diào)循證,引用的文章在系統(tǒng)中 100% 存在,讓其能夠做決策、信息夠充分;患者版本則強(qiáng)調(diào)補(bǔ)充信息,進(jìn)入啟發(fā)式端到端的問診,也給到患者決策能力。
“我們與 OpenEvidence 的區(qū)別在于,OpenEvidence 只是服務(wù)于醫(yī)生,百川是可復(fù)數(shù)、可懂、可決策、可行動(dòng)、能夠服務(wù)到患者的,這樣的產(chǎn)品定位在全球是獨(dú)一無二的。”王小川補(bǔ)充道。
在其看來,做 To C 產(chǎn)品,重點(diǎn)是讓產(chǎn)品價(jià)值觸達(dá)真正的目標(biāo)人群,即有嚴(yán)肅醫(yī)療需求、愿意為決策輔助付費(fèi)的患者。他舉例稱,達(dá)摩院做的胰腺癌平掃 CT 模型,雖然技術(shù)門檻高,但解決了核心臨床痛點(diǎn),就有明確的付費(fèi)方;而泛健康類服務(wù)看似覆蓋廣,但價(jià)值不突出,反而難以找到穩(wěn)定的付費(fèi)用戶。百川目前的做法就是基本全覆蓋,重點(diǎn)放在兒科、慢病和腫瘤,優(yōu)先突破有明確痛點(diǎn)的領(lǐng)域。
收費(fèi)模式上,王小川認(rèn)為,不是只賺醫(yī)院或醫(yī)生的錢,還可以向患者收費(fèi),也可以形成服務(wù)包,后面的醫(yī)療資源和藥械以服務(wù)包形式收費(fèi)。
“我倒不擔(dān)心商業(yè)模式本身,確實(shí)要過了這個(gè)門檻、為用戶創(chuàng)造價(jià)值,之后不管直接收費(fèi)還是生態(tài)收費(fèi)都是很容易的事情。”王小川說道。目前,百川賬上還有 30 億人民幣,這也留給了王小川證明的時(shí)間。
據(jù)王小川透露,今年上半年,百川會(huì)完成兩款產(chǎn)品的發(fā)布和推廣,核心是回歸決策層面,幫助用戶(包括患者和醫(yī)生)做出更好的醫(yī)療決策,最終實(shí)現(xiàn)“醫(yī)生時(shí)刻陪伴式”的健康管理。“我們第二個(gè)產(chǎn)品已經(jīng)可以當(dāng)成院外醫(yī)生來看了。”此外,百川也有計(jì)劃硬件產(chǎn)品發(fā)布和出海計(jì)劃,具體日程未定。
為了培養(yǎng)用戶心智,百川未來也會(huì)增加一定的廣告宣傳投入,另外會(huì)重視醫(yī)生對產(chǎn)品的認(rèn)可度。“阿福跟我們的路線不一樣,老醫(yī)生都是無感的。我們希望醫(yī)生和患者一體兩面,共享一款產(chǎn)品,要讓專家點(diǎn)頭,而不只是患者鼓掌。產(chǎn)品做好以后確實(shí)能夠取得一定的口碑效應(yīng)。”王小川說道。
“今年上市的兩家主要還是踩在通用模型技術(shù)紅利和政策支持的基礎(chǔ)上,但目前他們的市值和商業(yè)化能力并不匹配,但 AI 醫(yī)療今天也是大模型競爭中的一個(gè)范式,雖然它的成熟會(huì)晚一點(diǎn),在后面我們肯定也是奔著上市去的。”王小川給了自己兩年的時(shí)間再看看。
聲明:本文為 InfoQ 原創(chuàng),不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。
會(huì)議推薦
InfoQ 2026 全年會(huì)議規(guī)劃已上線!從 AI Infra 到 Agentic AI,從 AI 工程化到產(chǎn)業(yè)落地,從技術(shù)前沿到行業(yè)應(yīng)用,全面覆蓋 AI 與軟件開發(fā)核心賽道!集結(jié)全球技術(shù)先鋒,拆解真實(shí)生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點(diǎn),探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能,獲取實(shí)戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察,高效實(shí)現(xiàn)技術(shù)價(jià)值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點(diǎn),搶占 2026 智能升級(jí)發(fā)展先機(jī)!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.