手握30億、被螞蟻狂挖人，轉(zhuǎn)型被罵慘的王小川，真的翻身了？

2026-01-14 15:00:12　來源: InfoQ

北京舉報(bào)

分享至

作者 | 褚杏娟

在“大模型六小虎”成為歷史后，王小川終于等來了自己的風(fēng)口。

近日，國內(nèi)外大廠在醫(yī)療領(lǐng)域動(dòng)作頻繁。1 月 8 日，OpenAI 高調(diào)入局，除了推出 ChatGPT Health，還收購了醫(yī)療保健初創(chuàng)公司 Torch。幾乎同期，Anthropic、英偉達(dá)、蘋果等都有產(chǎn)品和合作發(fā)布。國內(nèi)，螞蟻阿福自發(fā)布后短期內(nèi)月活用戶突破 3000 萬，單日提問量超千萬。資本市場上，AI 醫(yī)療板塊逆勢走強(qiáng)，成為最近市場熱點(diǎn)。

在此前大模型競爭激烈的當(dāng)口，AI 醫(yī)療并不是一個(gè)很性感的話題。那種不信任來自百川內(nèi)外。

2023 年成立的百川在一年后戰(zhàn)略收縮，決定聚焦醫(yī)療，成為國內(nèi)較早專注到醫(yī)療的大模型創(chuàng)企。但內(nèi)部“沒有足夠傳達(dá)在醫(yī)療上的決心和路徑要求，沒有讓每個(gè)團(tuán)隊(duì)在醫(yī)療價(jià)值創(chuàng)造中深度思考 why 和 how，進(jìn)而導(dǎo)致部分團(tuán)隊(duì)工作目標(biāo)出現(xiàn)了搖擺和偏差。”“去年中途轉(zhuǎn)過來時(shí)被罵慘了。”

不只內(nèi)部，業(yè)界對 AI 醫(yī)療也存有疑慮，連帶著對百川的路線選擇也有質(zhì)疑。“2024 年跟醫(yī)生談 AI，大家都不信。”王小川直言。

直到 2025 年，大家看到 DeepSeek 真的比百度靠譜很多；年末阿福發(fā)布，投了 10 億來砸廣告，看到了技術(shù)和應(yīng)用進(jìn)展；今年 1 月 8 日，OpenAI Health 正式上線，Anthropic 也發(fā)布了自己的兩個(gè)技術(shù)能力：醫(yī)療計(jì)算和 Agent，兩個(gè)巨頭都開始進(jìn)入醫(yī)療。

“所以，從市場判斷來看，醫(yī)療作為 AI‘皇冠上的明珠’這樣的高級(jí)階段，已經(jīng)開始進(jìn)入應(yīng)用范疇。”王小川說道。

從發(fā)布反思信至今 9 個(gè)月過去，王小川向 InfoQ 表示，百川如今的護(hù)城河主要有三個(gè)：一是模型結(jié)構(gòu)的優(yōu)先級(jí)，“醫(yī)療安全性”和“診斷準(zhǔn)確性”始終是首位；二是切入點(diǎn)選擇，百川聚焦嚴(yán)肅、高價(jià)的醫(yī)療場景，區(qū)別于其他企業(yè)的健康類打法，這類場景的壁壘更高，且有明確的付費(fèi)意愿；三是產(chǎn)品形態(tài)的差異化，百川身份差異化服務(wù)和決策輔助能力，是現(xiàn)有產(chǎn)品不具備的。

王小川尤其提到，大廠和創(chuàng)業(yè)公司不一樣，他們有職業(yè)團(tuán)隊(duì)，需要的是更安穩(wěn)的方案。“大創(chuàng)新靠小廠，小創(chuàng)新靠大廠，必須切入我們認(rèn)為有高價(jià)值的事情，共識(shí)不是我們優(yōu)先的突破點(diǎn)，而大廠更多的是注重共識(shí)，路線圖和產(chǎn)品形態(tài)是不一樣的。”

1 模型要低幻覺、能問診，多模態(tài)非主戰(zhàn)場

“去年 8 月發(fā)布的 M2 作為百川重新聚焦醫(yī)療之后的主力模型，在行業(yè)得到很多好評(píng)。典型現(xiàn)象就是螞蟻開始瘋狂挖人，從技術(shù)人員到財(cái)務(wù)人員，所以屬于小圈子認(rèn)可技術(shù)路線圖。”王小川說道。

昨天，百川正式開源了新一代醫(yī)療大模型 Baichuan-M3。據(jù)百川智能模型技術(shù)負(fù)責(zé)人鞠強(qiáng)介紹，Baichuan 系列采用 SCAN 框架，實(shí)現(xiàn)臨床醫(yī)生層級(jí)的推理與問診。其核心在于不僅詢問疾病類型，更通過定量問題將模糊主訴轉(zhuǎn)化為可定位、可量化的臨床證據(jù)；并且突破單一癥狀的局限，進(jìn)行跨系統(tǒng)關(guān)聯(lián)推理。

其次，團(tuán)隊(duì)高度重視并主動(dòng)防控大模型在醫(yī)療中的“幻覺”，堅(jiān)持正確知識(shí)并進(jìn)行原子級(jí)事實(shí)檢驗(yàn)：在模型推理過程中進(jìn)行逐層事實(shí)核查，確保結(jié)論基于真實(shí)輸入。

鞠強(qiáng)介紹，在模型訓(xùn)練中，抑制“幻覺”與提升推理能力之間存在明顯的“蹺蹺板效應(yīng)”，容易陷入兩種極端：若過度追求推理表現(xiàn)，其生成內(nèi)容會(huì)更豐富、答對率上升，但幻覺也難以控制；若強(qiáng)力抑制幻覺，模型則會(huì)趨向過度保守，回答變得拘謹(jǐn)甚至回避問題，導(dǎo)致實(shí)用性下降。這也是團(tuán)隊(duì)在 Baichuan-M3 訓(xùn)練中重點(diǎn)攻克的問題。

為破解這一矛盾，研發(fā)團(tuán)隊(duì)引入了 Fact-aware 強(qiáng)化學(xué)習(xí)技術(shù)。該技術(shù)核心在于，在強(qiáng)化訓(xùn)練過程中，既對幻覺進(jìn)行充分壓制，又確保推理能力不受損，反而同步提升。

結(jié)果顯示，相比前代模型 M2，百川正式開源新一代醫(yī)療大模型 Baichuan-M3 的幻覺率大幅下降，同時(shí)在醫(yī)療專業(yè)評(píng)測 HealthBench 上的推理能力得分從 34 分顯著提升至 44 分，位列榜首。在不依賴工具或檢索增強(qiáng)的純模型設(shè)置下，醫(yī)療幻覺率 3.5，超越 GPT-5.2。“這驗(yàn)證了我們通過強(qiáng)化學(xué)習(xí)方法，在抑制幻覺與增強(qiáng)推理之間取得了有效平衡。”鞠強(qiáng)表示。

Hugging Face 地址：https://huggingface.co/baichuan-inc/Baichuan-M3-235B

GitHub 地址：https://github.com/baichuan-inc/Baichuan-M3-235B

另外，模型深度集成的問診能力，從日常癥狀中識(shí)別風(fēng)險(xiǎn)。團(tuán)隊(duì)設(shè)計(jì)了防御性思維追問，以甄別背后潛在的系統(tǒng)性疾病，還會(huì)進(jìn)行組合癥狀敏銳識(shí)別，比如用戶描述“情緒激動(dòng)時(shí)左牙疼”時(shí)，模型能會(huì)關(guān)聯(lián)“牙痛 + 情緒癥狀”，優(yōu)先建議排查心臟系統(tǒng)問題，從而排除重大隱患，而非直接推薦牙醫(yī)或止痛藥。該能力已集成至產(chǎn)品，服務(wù)于醫(yī)生與普通用戶。

在 AI 醫(yī)療中，除了文字，還有影像等信息。不過，王小川認(rèn)為，多模態(tài)并非當(dāng)前 AI 主戰(zhàn)場。

他解釋道，ChatGPT 之所以令人震撼，正是因?yàn)樗宫F(xiàn)出一種“智力”，而智力的本質(zhì)，是將具體事物進(jìn)行抽象的能力，其核心在于符號(hào)系統(tǒng)。在這一邏輯下，智能主要依托于三種形式語言：自然語言、數(shù)學(xué)語言與代碼語言。至今，評(píng)估一個(gè)模型能力的強(qiáng)弱，本質(zhì)上仍是檢驗(yàn)其符號(hào)處理與邏輯推理的水平，功能可用并不等同于智力高超。在醫(yī)療領(lǐng)域，這一觀點(diǎn)尤為關(guān)鍵。醫(yī)療的核心是決策，而不僅僅是感知。

實(shí)際上，未來醫(yī)學(xué)影像的初步解讀可由專用小模型完成，許多廠商也已具備相應(yīng)的圖像引擎。但真正的價(jià)值在于：將影像符號(hào)化之后，如何用語言模型進(jìn)行綜合推理與判斷。因此，感知模型與認(rèn)知模型必須結(jié)合。

他認(rèn)為，當(dāng)前的一些工作，比如將 CT 影像轉(zhuǎn)化為報(bào)告，或是專注于胰腺癌篩查的視覺模型，固然有其價(jià)值，但它們更像是“掛在智力之樹上的葉子”，是整體流程中的一環(huán)，而非驅(qū)動(dòng)智能演進(jìn)的主戰(zhàn)場。真正的突破，仍在于如何通過符號(hào)與語言，構(gòu)建能夠進(jìn)行復(fù)雜醫(yī)療決策的認(rèn)知核心。

2 “在中國 To C 比 To B 更好”

“未來巨大的增量是在院外，不在院內(nèi)。”王小川說道。其核心是直接服務(wù)患者，而不是通過服務(wù)醫(yī)生間接服務(wù)患者。

反觀 OpenAI 的入局是靠打造“個(gè)人超級(jí)助手”，Anthropic 則從合規(guī)性與臨床效率上做 B 端突圍。對此，王小川的評(píng)價(jià)是：“美國是 To C 和 To B 都可以干，但在中國 To C 比 To B 更好。”

王小川認(rèn)為，國內(nèi)的醫(yī)療現(xiàn)狀是醫(yī)生供給不足，互聯(lián)網(wǎng)雖能連接信息卻無法創(chuàng)造供給；醫(yī)患權(quán)力不均，雙方容易溝通不暢、患者無助；患者更傾向三甲醫(yī)院，致使基層醫(yī)療薄弱；醫(yī)療知識(shí)分散于各科室，復(fù)雜病癥往往缺乏整體視角。

基于此，他的設(shè)想是 AI 可以“造出高質(zhì)量醫(yī)生”，但不是要 AI 取代醫(yī)生。“在某些維度上，AI 超過醫(yī)生是必然的，比如信息收集的完整性、醫(yī)學(xué)知識(shí)的儲(chǔ)備量、循證的精準(zhǔn)度等。但 AI 不會(huì)取代醫(yī)生的核心執(zhí)行能力，比如手術(shù)、查體等。”

在不取代醫(yī)生的情況下，AI 可以推動(dòng)“權(quán)力讓渡”，即幫助患者理解病情與方案，獲得更多參與權(quán)和知情權(quán)。另外，居家通過 AI 進(jìn)行初步咨詢，讓“居家首診”可能，減輕醫(yī)療系統(tǒng)負(fù)擔(dān)。此外，復(fù)雜問題需要跨科室會(huì)診，以前就是入院即入組，即進(jìn)入某個(gè)科研隊(duì)列，有了 AI 后能夠做到“看病即入組”，更有機(jī)會(huì)做好生命模型。

在實(shí)現(xiàn)的產(chǎn)品形態(tài)上，百川目前主打還是百小應(yīng) App，不過用戶進(jìn)入后可以選擇醫(yī)生和患者兩種身份，給出的結(jié)果是不一樣的：醫(yī)生版更像 OpenEvidence，答案更加專業(yè)、更加強(qiáng)調(diào)循證，引用的文章在系統(tǒng)中 100% 存在，讓其能夠做決策、信息夠充分；患者版本則強(qiáng)調(diào)補(bǔ)充信息，進(jìn)入啟發(fā)式端到端的問診，也給到患者決策能力。

“我們與 OpenEvidence 的區(qū)別在于，OpenEvidence 只是服務(wù)于醫(yī)生，百川是可復(fù)數(shù)、可懂、可決策、可行動(dòng)、能夠服務(wù)到患者的，這樣的產(chǎn)品定位在全球是獨(dú)一無二的。”王小川補(bǔ)充道。

在其看來，做 To C 產(chǎn)品，重點(diǎn)是讓產(chǎn)品價(jià)值觸達(dá)真正的目標(biāo)人群，即有嚴(yán)肅醫(yī)療需求、愿意為決策輔助付費(fèi)的患者。他舉例稱，達(dá)摩院做的胰腺癌平掃 CT 模型，雖然技術(shù)門檻高，但解決了核心臨床痛點(diǎn)，就有明確的付費(fèi)方；而泛健康類服務(wù)看似覆蓋廣，但價(jià)值不突出，反而難以找到穩(wěn)定的付費(fèi)用戶。百川目前的做法就是基本全覆蓋，重點(diǎn)放在兒科、慢病和腫瘤，優(yōu)先突破有明確痛點(diǎn)的領(lǐng)域。

收費(fèi)模式上，王小川認(rèn)為，不是只賺醫(yī)院或醫(yī)生的錢，還可以向患者收費(fèi)，也可以形成服務(wù)包，后面的醫(yī)療資源和藥械以服務(wù)包形式收費(fèi)。

“我倒不擔(dān)心商業(yè)模式本身，確實(shí)要過了這個(gè)門檻、為用戶創(chuàng)造價(jià)值，之后不管直接收費(fèi)還是生態(tài)收費(fèi)都是很容易的事情。”王小川說道。目前，百川賬上還有 30 億人民幣，這也留給了王小川證明的時(shí)間。

據(jù)王小川透露，今年上半年，百川會(huì)完成兩款產(chǎn)品的發(fā)布和推廣，核心是回歸決策層面，幫助用戶（包括患者和醫(yī)生）做出更好的醫(yī)療決策，最終實(shí)現(xiàn)“醫(yī)生時(shí)刻陪伴式”的健康管理。“我們第二個(gè)產(chǎn)品已經(jīng)可以當(dāng)成院外醫(yī)生來看了。”此外，百川也有計(jì)劃硬件產(chǎn)品發(fā)布和出海計(jì)劃，具體日程未定。

為了培養(yǎng)用戶心智，百川未來也會(huì)增加一定的廣告宣傳投入，另外會(huì)重視醫(yī)生對產(chǎn)品的認(rèn)可度。“阿福跟我們的路線不一樣，老醫(yī)生都是無感的。我們希望醫(yī)生和患者一體兩面，共享一款產(chǎn)品，要讓專家點(diǎn)頭，而不只是患者鼓掌。產(chǎn)品做好以后確實(shí)能夠取得一定的口碑效應(yīng)。”王小川說道。

“今年上市的兩家主要還是踩在通用模型技術(shù)紅利和政策支持的基礎(chǔ)上，但目前他們的市值和商業(yè)化能力并不匹配，但 AI 醫(yī)療今天也是大模型競爭中的一個(gè)范式，雖然它的成熟會(huì)晚一點(diǎn)，在后面我們肯定也是奔著上市去的。”王小川給了自己兩年的時(shí)間再看看。

聲明：本文為 InfoQ 原創(chuàng)，不代表平臺(tái)觀點(diǎn)，未經(jīng)許可禁止轉(zhuǎn)載。

會(huì)議推薦

InfoQ 2026 全年會(huì)議規(guī)劃已上線！從 AI Infra 到 Agentic AI，從 AI 工程化到產(chǎn)業(yè)落地，從技術(shù)前沿到行業(yè)應(yīng)用，全面覆蓋 AI 與軟件開發(fā)核心賽道！集結(jié)全球技術(shù)先鋒，拆解真實(shí)生產(chǎn)案例、深挖技術(shù)與產(chǎn)業(yè)落地痛點(diǎn)，探索前沿領(lǐng)域、聚焦產(chǎn)業(yè)賦能，獲取實(shí)戰(zhàn)落地方案與前瞻產(chǎn)業(yè)洞察，高效實(shí)現(xiàn)技術(shù)價(jià)值轉(zhuǎn)化。把握行業(yè)變革關(guān)鍵節(jié)點(diǎn)，搶占 2026 智能升級(jí)發(fā)展先機(jī)！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.