![]()
2026,AI醫療已成燎原之勢,但一線醫護人員的體感,卻常常被忽視。
無論模型如何更迭,能否被醫生群體大規模采用,才是AI真正滲透醫療保健的關鍵。
但目前,臨床一線“不敢用、不會用、不愛用AI”的情況仍普遍存在。
近期,張文宏教授拒絕把AI引入醫院病歷系統,成為輿論熱點。
這背后,其實體現了廣大中國醫生對AI“幻覺”的高度警惕。
而在美國,OpenEvidence已經吸引了近半數的醫生使用。
這揭示了一個關鍵現實:醫生并非抗拒技術,而是渴望真正可用、可靠、可及的AI工具。
如何打動醫生這一用戶群體,成為推動中國AI醫療發展的關鍵命題。
而今天,百川智能給出了答案。
就在剛剛,百川智能Baichuan-M3 Plus正式發布。
這是繼上周發布并開源最強醫療大模型Baichuan-M3后,又一次重大的升級。
新模型在幻覺控制能力上進一步提高,幻覺率降低至2.6%,刷新了M3所創下的世界紀錄。
![]()
同時,首創“證據錨定”技術,讓每一句結論,都可核驗、可追責、可教學。
不僅如此,新模型使用成本進一步降低,僅為上一代M2 Plus的30%,掃清規模化應用障礙。
更加驚喜的是,百川宣布,全面開放M3 Plus的技術能力,API限時免費體驗15天,所有開發者均可申請使用。
并且,百川正式發起「海納百川」計劃,面向所有為醫務工作者提供服務的機構,免費提供M3 Plus的API。
這意味著,公司選擇將全球最強的醫療AI能力交付給更多的生態伙伴,向行業打開了一個共贏的未來。
百川智能創始人王小川表示:“我們希望讓更多人有機會體驗并受益于當今全球最先進的大模型技術,讓醫療行業這片‘大海’依托‘百川’的先進能力,全面提升醫學服務水平。”
憑借極致的性能優化與普惠的開放精神,百川正在打通頂尖模型與真實診療場景的最后一公里。
而最終受益的,將是每一位對健康生活懷有期待的普通人。
三大突破,重新定義醫療大模型的“可用、可信、可及”
1、幻覺率再創新低:堅守醫療AI可靠性紅線,解決醫生“不敢用”。
幻覺是大模型與生俱來的算法特性,但在醫療場景,幻覺意味著風險。
像deepseek、豆包這樣的通用大模型,存在大量的幻覺,無法讓醫生建立信任。
出于對行業的深刻洞察,百川率先將“降低幻覺”列為重點目標。
去年發布的Baichuan-M2 Plus,百川首創了“六源循證”,將循證醫學范式引入模型。
直接結果是,M2 Plus的幻覺率較通用大模型顯著降低,僅為deepseek-r1的1/3,比肩資深臨床專家。
而百川上周發布的Baichuan-M3,則再次大幅降低了幻覺,
團隊首創了一套事實感知強化學習(Fact-Aware RL)架構,使得M3在不依賴任何外部工具的情況下,幻覺率降至3.5%。
這一數字,擊敗了最新的GPT-5.2,位列全球最好成績。
本次推出的M3 Plus,在M3的底座上,融合了M2 Plus的靈魂——六源循證。
幻覺率進一步降低,僅為2.6%,相較GPT-5.2大幅下降超30%,也超越了Open Evidence。
2、首創“證據錨定”:每一句結論皆有據可依,使醫生真正“信得過”。
在醫療中,對于證據的引用是“必選項”。
醫生是否信任AI,往往取決于AI能否出真實、準確的文獻出處。
長期以來,行業對引用的關注,流于表面。
即只要求“引用有”,不要求“引用對”。在準確性方面,缺乏重視。
這導致,當前醫療大模型在引用時常出現各種錯誤。
要么是引用編號存在,但文獻內容對不上(張冠李戴)
要么是文獻本身正確,但被引用的段落與結論并不匹配,甚至存在拼接、誤讀(內容沖突)。
為此,在M3 Plus的訓練中,百川首創了“證據錨定(Evidence Anchoring)”技術。
簡單說,就是在模型的每一次引用中,都加入明確的獎懲機制。
每當模型進行錯誤引用,懲罰機制就會介入,幫助修正。
讓模型只能在“確實有證據支持”的空間中推理與生成,“引用正確性”被內化到模型訓練的始終。
最終,結論與證據段落的匹配準確率超過95%,真正讓AI的醫學判斷做到可核驗、可追責、可教學。
![]()
3、價格下探70%:工程優化大幅降低成本,讓醫療行業“用得起”。
醫療AI要廣泛應用,效果可靠是門檻,成本才是命門。
即便是最先進的模型,如果跑不動、用不起,也無法在大規模臨床中產生價值。
M3 Plus直面這一挑戰,在不犧牲性能的前提下,將綜合使用成本較上一代降低了70%。
這背后,是百川對模型架構和推理路徑的極致優化。
所有這些努力,最終指向一個目標:讓強大的醫療AI,用得起、跑得快、落得下。
超越OpenEvidence,百川做的更多、想的更遠
在討論AI醫療之時,一個繞不開的案例便是OpenEvidence。
這家公司專門為醫生群體打造了一個可信賴的“醫療版ChatGPT”。
這款AI產品不接受互聯網信息,只在專業醫學期刊的高質量數據上訓練,從源頭上減少了幻覺問題。
短短幾年,OpenEvidence便創造了醫療APP史上的增長神話。
如今,超過45%的美國醫生使用OpenEvidence,每年超過1億美國人接受了醫生使用OpenEvidence進行治療。
就在昨天,OpenEvidence宣布完成2.5億美元D輪融資,最新估值達120億美元。
OpenEvidence的成功,向行業傳遞出一個關鍵信號:
在醫學信息爆炸式增長的今天,一款可靠、好用的AI助手,是醫生群體的“必需品”。
而對于中國的醫生來說,這一龐大的需求尚未滿足。
瞄準這個痛點,百川不斷實踐,探索出一條更加符合中國國情的醫療AI落地之路。
在性能層面,團隊做到了領跑全球,
憑借獨創的六源循證技術與M3基座結合,M3 Plus將幻覺率降低至2.6%,優于Open Evidence。
在戰略層面,百川更是降維打擊。
與單純做一款應用不同,百川選擇了難度更高、意義更大的路徑:
免費提供M3Plus的API,將全球幻覺最低的循證增強醫療大模型開放給整個醫療行業。
這意味著更多醫療機構、開發者可據此快速開發出適合自身需求的醫療AI應用。
這一行動,為AI醫療的應用提供了更多可能,觸達更豐富多元的真實場景。
當前,醫院仍是醫療服務的中心,醫生仍是醫療過程的核心。
團隊對此有深刻理解,選擇用極致的技術透明和普惠精神,讓大模型與醫生、醫院建立合作信任。
此次推出的「海納百川」活動,便是上述理念的生動詮釋。
王小川表示,希望通過免費、持續且長期的使用,讓行業伙伴能夠更加安心地探索與嘗試,深入理解各類應用場景,最終為患者帶來福祉。
最終,百川想要做的,是將頂尖醫療模型能力,轉化為“醫院能用、醫生敢用、患者愿用”的基礎設施,加速中國AI醫療的全面普及。
百川智能,為全球AI醫療樹立標桿
進入2026年,醫療已經成為AI比拼的主戰場。
1月8日,OpenAI推出了旗下首款AI醫療產品ChatGPT Health,允許用戶將醫療記錄和健康應用連接至AI,打造“個人超級健康助手”。
1月11日,Anthropic官宣Claude for Healthcare,瞄準整個醫療系統、保險、患者、乃至上游藥物研發等各個環節。
1月13日,谷歌發布最新開源醫療模型MedGemma 1.5,在多模態應用上實現重大突破。
AI巨頭布局醫療健康的動作明顯加快,印證了王小川之前的判斷:醫療正迅速從「非共識」走向「共識」。
而百川智能,正是第一家探索AI與醫療如何高效結合的大模型公司。
一路走來,百川持續深耕醫療這一高度垂直的領域,在底層模型上具備深厚積累,并持續探索醫療AI落地路徑。
當前,AI+醫療方興未艾,于真實場景的應用更是處于早期。
通過開放合作構建寬廣的創新生態,將蛋糕做得更大,最終帶動整個行業的繁榮,是百川智能作為領軍者的戰略遠見。
站在AI深度融入醫療健康的關鍵節點,百川愿與上下游合作伙伴深度協同,共同加速“天下無病”的到來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.