【TechWeb】1月22日消息,百川智能正式發布 BAIchuan-M3 Plus,嚴肅醫療場景下的問答準確性、可靠性,再次刷新了剛剛推出的M3所創下的世界紀錄。憑借獨創的六源循證技術與M3基座結合,M3 Plus將幻覺率降低至2.6%,低于 Open Evidence,達到全球最低水平;首創“證據錨定”技術,不僅給出引文來源,還能將模型生成的每一句醫學結論,精確錨定到原始論文中的對應證據段落,使 AI 的醫學判斷真正做到可核驗、可追責、可教學。
![]()
同時,百川宣布推出「海納百川」計劃,將全球最低幻覺的循證增強醫療大模型以API形式,免費開放給中國醫療服務機構,共同繁榮國內的AI醫療生態,推動中國AI醫療的變革,讓每一位中國醫務工作者都能擁有可靠、好用的AI助手。
上周百川M3大模型的正式開源,M3不僅在 Healthbench、Healthbench Hard 等多個權威評測中登頂榜首,實現了對 GPT-5.2的全面超越,更在 OpenAI 引以為傲的低幻覺領域完成超越,以3.5%的幻覺率領跑全球。M3 Plus的事實性幻覺降低到新的SOTA,僅2.6%,相較GPT-5.2大幅下降超30%。即便與行業標桿 Open Evidence相比,M3 Plus 也完成了超越。
![]()
值得注意的是,百川 M3 Plus 首創“證據錨定(Evidence Anchoring)”技術,不是簡單標注“引用自哪篇文獻”,而是要求模型生成的每一句醫學結論,都必須精確對應到原始論文或指南中的具體證據段落。每一句判斷,都能被逐字溯源、逐條核驗。
為實現這一目標,百川將“證據錨定”作為獨立訓練目標,引入 Citation Reward Model,對錯誤引用進行明確懲罰,讓模型只能在“確實有證據支持”的空間中推理與生成。最終,結論與證據段落的匹配準確率超過 95%,真正讓 AI 的醫學判斷做到可核驗、可追責、可教學。
M3 Plus 在系統層面進行了全面的工程重構,通過 MoE 架構優化、模型量化以及 Gated Eagle-3 投機解碼等關鍵技術,在嚴格保證模型能力與可靠性的前提下,實現了 API 調用成本較上一代降低 70%,為 AI 在醫療場景的規模化應用掃清了關鍵障礙。百川全面開放M3 Plus的技術能力,API限時免費體驗15天,所有開發者均可申請使用。
另外,百川發起 「海納百川」計劃:面向所有服務醫務工作者的機構,免費提供全球幻覺最低循證增強醫療大模型 M3 Plus 的 API,把服務醫生的AI能力直接交到生態伙伴手里。
附「海納百川」計劃|參與條件:
適用對象:
為醫務工作者提供服務的機構
醫務工作者包括醫生、藥劑師、醫技師、護士、健管師、醫學生等
適用場景僅限于:
臨床輔助決策、醫學教育
用途限制:
僅用于真實服務場景、不得用于數據生產
使用要求:
產品需明確展示 Powered by 百川、不得對模型輸出進行影響準確性的修改
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.