網易首頁 > 網易號 > 正文申請入駐

Baichuan-M3來了！硬核實力讓醫療AI既好用又靠譜

2026-01-16 10:41:28　來源: 梅斯醫學

上海舉報

分享至

當下的AI領域，醫療賽道已然成為巨頭與創新企業爭相布局的焦點。新年伊始，OpenAI便宣布推出ChatGPT Health，緊接著Anthropic上線Claude for Healthcare。在這之前，專注醫療領域的OpenEvidence更是收獲了40%美國醫生的注冊使用，僅2025年一年估值就實現10倍增長。全球AI醫療市場正邁入萬億級增長通道。根據知名咨詢機構Fortune Business Insights的報告，2025年，全球醫療保健人工智能市場規模為393.4億美元。預計該市場將從2026年的560.1億美元增長到2034年的10332.7億美元，預測期內復合年增長率為43.96%[1]。

這場全球范圍內的熱潮，根源在于醫療行業長期存在的剛性需求——優質醫療資源在城鄉與區域間分布不均，基層醫療機構診療能力薄弱；醫生面對復雜病例時缺乏高效決策支持，海量醫學知識的快速迭代也讓他們不堪重負；患者就醫時往往難以系統描述病癥，從網絡上獲取的醫療信息又碎片化、真假難辨。理論上，AI醫療被寄予厚望，有望打破資源壁壘、提升診療效率、彌合知識鴻溝，成為破解醫療行業痛點的關鍵力量。

但熱潮背后，AI醫療在臨床場景的落地卻面臨諸多阻礙，理想與現實之間仍有不小差距。現有多數醫療AI產品停留在靜態問答層面，僅能對明確的醫學問題給出標準化回復，無法應對臨床中信息不完整、病情復雜多變的真實場景。更關鍵的是，高幻覺率成為行業頑疾，部分模型為追求“看似合理”的回復而編造醫學事實，在關乎生命健康的醫療場景中潛藏巨大安全風險。此外，傳統醫療AI缺乏主動問診能力，只能被動接收患者提供的信息，而患者往往難以精準表述病癥細節和關鍵病史，導致模型無法獲取足夠信息支撐可靠決策。這些問題共同導致醫療AI難以獲得醫患雙方的充分信任，制約了其在臨床場景的規模化應用。市場迫切需要一款真正能解決這些痛點，既具備專業能力又安全可信的醫療AI產品。

Baichuan-M3實現三大核心突破，重塑醫療AI性能標桿

正是在這樣的行業背景下，百川智能開源發布的新一代醫療大模型Baichuan-M3應運而生，憑借三大核心能力實現關鍵突破，為AI醫療的臨床落地提供了可行路徑。

Baichuan-M3的性能優勢首先體現在權威評測的亮眼表現上。在全球公認最權威的HealthBench醫療評測中，它以65.1分的綜合成績登頂排行榜，在考驗復雜決策能力的HealthBench Hard子集更是拿下44.4分，成功實現對GPT5.2的全面超越，確立了全球領先的醫療溝通與推理能力。這一評測由262位來自60個國家的醫生共同構建，包含5000組高度逼真的多輪醫療對話，是目前最貼近真實臨床場景的權威評測體系，Baichuan-M3的奪冠意味著其在復雜醫學問題處理上已達到行業最優水平，能夠為臨床決策提供強有力的支持。

解決幻覺問題是Baichuan-M3的另一大核心突破，其3.5%的醫療幻覺率創下全球最低紀錄。幻覺是醫療AI的“致命缺陷”，在嚴肅醫療場景中，一句不準確的信息就可能引發嚴重的安全事件。為攻克這一難題，百川智能將醫學事實一致性融入模型訓練核心，通過事實感知強化學習架構，讓模型在強化推理能力的同時，主動規避虛假信息輸出。這種將“低幻覺”內化為模型基礎能力的訓練方式，使Baichuan-M3在不依賴外部工具校驗的情況下，依然能提供穩定可信的醫學回復，徹底解決了醫療AI“不可信”的關鍵痛點，讓醫患雙方都能放心使用。

原生端到端嚴肅問診能力則讓Baichuan-M3真正具備了“醫生思維”。不同于傳統模型通過“角色扮演”實現的表面化問診，Baichuan-M3基于SCAN原則，構建了安全分層、信息澄清、關聯追問與規范輸出的完整問診邏輯，能夠像資深醫生一樣主動引導患者描述癥狀，精準捕捉關鍵病史與風險信號。在此基礎上，百川聯合150多位一線醫生搭建的SCAN-bench評測體系中，其問診得分為74.9分，顯著高于人類醫生基線水平，真正實現了從“被動應答”到“主動問診”的跨越，有效解決了患者無法清晰表述病情的行業痛點。

醫生端、患者端、行業端全場景深度賦能，構建醫療服務新生態

三大核心能力的突破，讓Baichuan-M3的技術優勢真正轉化為行業價值，在醫生、患者、醫療機構等多個維度實現全場景賦能，而百川旗下醫療應用百小應的實際案例，更直觀展現了這些能力在臨床中的落地效果。

對醫生與醫學生而言，百小應已同步接入Baichuan-M3的全部能力，成為臨床診療與科研學習的得力助手。面對一名首發癥狀為發熱的10歲男童，Baichuan-M3沒有局限于常見的呼吸道感染思路，而是先排除高危感染等緊急情況，隨后抓住“發熱遷延+下肢關節腫痛”的關鍵線索，通過追問發現尿痛、生殖器小潰瘍等前驅感染癥狀，最終精準定位為反應性關節病。相比之下，其他頂尖模型要么過早收斂到川崎病診斷，要么局限于呼吸道感染的常規思路，均出現診斷偏差。這種精準的鑒別診斷能力，能有效輔助醫生尤其是基層醫生處理復雜病例，減少誤診漏診風險。同時，百小應還能為醫學生提供標準化臨床模擬訓練，幫助其快速積累診療經驗，在科研工作中，也能協助整理數據、梳理文獻，大幅提升科研效率。

對患者而言，百小應成為連接自身與醫療專業知識的橋梁，讓就醫過程更清晰、更安心。一位用戶因長期熬夜出現視物重影，咨詢是否可以滴眼藥水，百小應不僅推薦了對癥的七葉洋地黃雙苷滴眼液等藥物，還詳細說明了使用注意事項，同時提醒遵循“20-20-20”用眼原則、保證充足睡眠等非藥物干預措施。更重要的是，模型沒有局限于視疲勞的常規判斷，而是通過追問“重影是單眼還是雙眼”“是否伴隨頭痛惡心”等關鍵問題，排除神經系統疾病等潛在風險。另一位用戶在情緒激動后出現左側下牙床間歇性疼痛，百小應敏銳捕捉到“情緒應激+下頜疼痛”的危險組合，優先提示排除心源性牽涉痛等致命風險，再逐步排查三叉神經痛、牙髓炎等常見病因，這種從急重癥到常見病的排查邏輯，既符合醫生思維，又符合臨床規范。

對于醫院、藥廠等醫療機構，Baichuan-M3作為開源模型，支持直接部署使用，將頂級臨床能力轉化為可復用的行業基礎設施。基層醫院通過部署該模型，可快速提升診療水平，縮小與三甲醫院的差距；藥廠在藥物研發過程中，可借助模型快速梳理醫學文獻、分析臨床數據，加速研發進程。這種開源共享的模式，有效降低了優質醫療資源的復用成本。

深耕嚴肅醫療，引領行業長期發展

在AI醫療賽道同質化競爭日益激烈的當下，百川智能始終堅守嚴肅醫療定位，走出了一條差異化的長期主義道路，這也讓Baichuan-M3的出現更具行業引領意義。與阿福、小荷醫生等聚焦健康咨詢的平臺不同，百川智能從一開始就將臨床決策支持作為核心目標，堅守醫療“安全第一”的原則，這種精準定位使其在全球AI醫療爆發期占據了戰略制高點。

從2025年8月Baichuan-M2發布并成為開源醫療模型標桿，到如今Baichuan-M3實現三大核心能力的全面突破，短短五個月時間，百川智能展現了持續迭代的技術實力與產業前瞻性。而百小應的頻繁版本更新，也預示著百川智能在醫療AI應用側的深度布局。

當前，全球AI醫療正加速爆發，市場競爭已從單一的模型性能比拼，轉向在可靠性、實用性、生態化等維度比拼的綜合實力較量。Baichuan-M3的發布，不僅刷新了醫療大模型的性能基準，更重新定義了醫療AI的發展方向——只有以臨床需求為導向，以安全可信為底線，才能真正實現AI與醫療行業的深度融合。

相信隨著更多醫療機構的部署應用，以及百小應等產品功能的持續豐富，Baichuan-M3將持續釋放技術價值，推動醫療AI從“能用”向“好用、可信”全面轉型，為解決醫療資源不均、提升全民健康水平貢獻力量，而百川智能也將憑借其技術積累與行業洞察，持續引領全球嚴肅醫療AI的發展浪潮。M3已經在百小應同步上線，希望借助醫療AI提升自身醫學知識的醫學生，以及愿意擁抱AI，希望通過AI輔助自己診療決策的醫生，不妨下載體驗一下這款“可靠”的AI醫療產品。

參考文獻：

[1] 萬肇生. AI醫療“造富神話”！OpenAI 1億美元買了家只有4人的公司.觀察者網. https://baijiahao.baidu.com/s?id=1854280152439857156&wfr=spider&for=pc, 2026年1月15日/引用日期.

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.