![]()
當下的AI領域,醫療賽道已然成為巨頭與創新企業爭相布局的焦點。新年伊始,OpenAI便宣布推出ChatGPT Health,緊接著Anthropic上線Claude for Healthcare。在這之前,專注醫療領域的OpenEvidence更是收獲了40%美國醫生的注冊使用,僅2025年一年估值就實現10倍增長。全球AI醫療市場正邁入萬億級增長通道。根據知名咨詢機構Fortune Business Insights的報告,2025年,全球醫療保健人工智能市場規模為393.4億美元。預計該市場將從2026年的560.1億美元增長到2034年的10332.7億美元,預測期內復合年增長率為43.96%[1]。
這場全球范圍內的熱潮,根源在于醫療行業長期存在的剛性需求——優質醫療資源在城鄉與區域間分布不均,基層醫療機構診療能力薄弱;醫生面對復雜病例時缺乏高效決策支持,海量醫學知識的快速迭代也讓他們不堪重負;患者就醫時往往難以系統描述病癥,從網絡上獲取的醫療信息又碎片化、真假難辨。理論上,AI醫療被寄予厚望,有望打破資源壁壘、提升診療效率、彌合知識鴻溝,成為破解醫療行業痛點的關鍵力量。
但熱潮背后,AI醫療在臨床場景的落地卻面臨諸多阻礙,理想與現實之間仍有不小差距。現有多數醫療AI產品停留在靜態問答層面,僅能對明確的醫學問題給出標準化回復,無法應對臨床中信息不完整、病情復雜多變的真實場景。更關鍵的是,高幻覺率成為行業頑疾,部分模型為追求“看似合理”的回復而編造醫學事實,在關乎生命健康的醫療場景中潛藏巨大安全風險。此外,傳統醫療AI缺乏主動問診能力,只能被動接收患者提供的信息,而患者往往難以精準表述病癥細節和關鍵病史,導致模型無法獲取足夠信息支撐可靠決策。這些問題共同導致醫療AI難以獲得醫患雙方的充分信任,制約了其在臨床場景的規模化應用。市場迫切需要一款真正能解決這些痛點,既具備專業能力又安全可信的醫療AI產品。
Baichuan-M3實現三大核心突破,重塑醫療AI性能標桿
正是在這樣的行業背景下,百川智能開源發布的新一代醫療大模型Baichuan-M3應運而生,憑借三大核心能力實現關鍵突破,為AI醫療的臨床落地提供了可行路徑。
Baichuan-M3的性能優勢首先體現在權威評測的亮眼表現上。在全球公認最權威的HealthBench醫療評測中,它以65.1分的綜合成績登頂排行榜,在考驗復雜決策能力的HealthBench Hard子集更是拿下44.4分,成功實現對GPT5.2的全面超越,確立了全球領先的醫療溝通與推理能力。這一評測由262位來自60個國家的醫生共同構建,包含5000組高度逼真的多輪醫療對話,是目前最貼近真實臨床場景的權威評測體系,Baichuan-M3的奪冠意味著其在復雜醫學問題處理上已達到行業最優水平,能夠為臨床決策提供強有力的支持。
解決幻覺問題是Baichuan-M3的另一大核心突破,其3.5%的醫療幻覺率創下全球最低紀錄。幻覺是醫療AI的“致命缺陷”,在嚴肅醫療場景中,一句不準確的信息就可能引發嚴重的安全事件。為攻克這一難題,百川智能將醫學事實一致性融入模型訓練核心,通過事實感知強化學習架構,讓模型在強化推理能力的同時,主動規避虛假信息輸出。這種將“低幻覺”內化為模型基礎能力的訓練方式,使Baichuan-M3在不依賴外部工具校驗的情況下,依然能提供穩定可信的醫學回復,徹底解決了醫療AI“不可信”的關鍵痛點,讓醫患雙方都能放心使用。
原生端到端嚴肅問診能力則讓Baichuan-M3真正具備了“醫生思維”。不同于傳統模型通過“角色扮演”實現的表面化問診,Baichuan-M3基于SCAN原則,構建了安全分層、信息澄清、關聯追問與規范輸出的完整問診邏輯,能夠像資深醫生一樣主動引導患者描述癥狀,精準捕捉關鍵病史與風險信號。在此基礎上,百川聯合150多位一線醫生搭建的SCAN-bench評測體系中,其問診得分為74.9分,顯著高于人類醫生基線水平,真正實現了從“被動應答”到“主動問診”的跨越,有效解決了患者無法清晰表述病情的行業痛點。
醫生端、患者端、行業端全場景深度賦能,構建醫療服務新生態
三大核心能力的突破,讓Baichuan-M3的技術優勢真正轉化為行業價值,在醫生、患者、醫療機構等多個維度實現全場景賦能,而百川旗下醫療應用百小應的實際案例,更直觀展現了這些能力在臨床中的落地效果。
對醫生與醫學生而言,百小應已同步接入Baichuan-M3的全部能力,成為臨床診療與科研學習的得力助手。面對一名首發癥狀為發熱的10歲男童,Baichuan-M3沒有局限于常見的呼吸道感染思路,而是先排除高危感染等緊急情況,隨后抓住“發熱遷延+下肢關節腫痛”的關鍵線索,通過追問發現尿痛、生殖器小潰瘍等前驅感染癥狀,最終精準定位為反應性關節病。相比之下,其他頂尖模型要么過早收斂到川崎病診斷,要么局限于呼吸道感染的常規思路,均出現診斷偏差。這種精準的鑒別診斷能力,能有效輔助醫生尤其是基層醫生處理復雜病例,減少誤診漏診風險。同時,百小應還能為醫學生提供標準化臨床模擬訓練,幫助其快速積累診療經驗,在科研工作中,也能協助整理數據、梳理文獻,大幅提升科研效率。
對患者而言,百小應成為連接自身與醫療專業知識的橋梁,讓就醫過程更清晰、更安心。一位用戶因長期熬夜出現視物重影,咨詢是否可以滴眼藥水,百小應不僅推薦了對癥的七葉洋地黃雙苷滴眼液等藥物,還詳細說明了使用注意事項,同時提醒遵循“20-20-20”用眼原則、保證充足睡眠等非藥物干預措施。更重要的是,模型沒有局限于視疲勞的常規判斷,而是通過追問“重影是單眼還是雙眼”“是否伴隨頭痛惡心”等關鍵問題,排除神經系統疾病等潛在風險。另一位用戶在情緒激動后出現左側下牙床間歇性疼痛,百小應敏銳捕捉到“情緒應激+下頜疼痛”的危險組合,優先提示排除心源性牽涉痛等致命風險,再逐步排查三叉神經痛、牙髓炎等常見病因,這種從急重癥到常見病的排查邏輯,既符合醫生思維,又符合臨床規范。
對于醫院、藥廠等醫療機構,Baichuan-M3作為開源模型,支持直接部署使用,將頂級臨床能力轉化為可復用的行業基礎設施。基層醫院通過部署該模型,可快速提升診療水平,縮小與三甲醫院的差距;藥廠在藥物研發過程中,可借助模型快速梳理醫學文獻、分析臨床數據,加速研發進程。這種開源共享的模式,有效降低了優質醫療資源的復用成本。
深耕嚴肅醫療,引領行業長期發展
在AI醫療賽道同質化競爭日益激烈的當下,百川智能始終堅守嚴肅醫療定位,走出了一條差異化的長期主義道路,這也讓Baichuan-M3的出現更具行業引領意義。與阿福、小荷醫生等聚焦健康咨詢的平臺不同,百川智能從一開始就將臨床決策支持作為核心目標,堅守醫療“安全第一”的原則,這種精準定位使其在全球AI醫療爆發期占據了戰略制高點。
從2025年8月Baichuan-M2發布并成為開源醫療模型標桿,到如今Baichuan-M3實現三大核心能力的全面突破,短短五個月時間,百川智能展現了持續迭代的技術實力與產業前瞻性。而百小應的頻繁版本更新,也預示著百川智能在醫療AI應用側的深度布局。
當前,全球AI醫療正加速爆發,市場競爭已從單一的模型性能比拼,轉向在可靠性、實用性、生態化等維度比拼的綜合實力較量。Baichuan-M3的發布,不僅刷新了醫療大模型的性能基準,更重新定義了醫療AI的發展方向——只有以臨床需求為導向,以安全可信為底線,才能真正實現AI與醫療行業的深度融合。
相信隨著更多醫療機構的部署應用,以及百小應等產品功能的持續豐富,Baichuan-M3將持續釋放技術價值,推動醫療AI從“能用”向“好用、可信”全面轉型,為解決醫療資源不均、提升全民健康水平貢獻力量,而百川智能也將憑借其技術積累與行業洞察,持續引領全球嚴肅醫療AI的發展浪潮。M3已經在百小應同步上線,希望借助醫療AI提升自身醫學知識的醫學生,以及愿意擁抱AI,希望通過AI輔助自己診療決策的醫生,不妨下載體驗一下這款“可靠”的AI醫療產品。
![]()
參考文獻:
[1] 萬肇生. AI醫療“造富神話”!OpenAI 1億美元買了家只有4人的公司.觀察者網. https://baijiahao.baidu.com/s?id=1854280152439857156&wfr=spider&for=pc, 2026年1月15日/引用日期.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.