<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      世界最強醫療模型百川M3發布:AI醫療,奇點已至

      0
      分享至


      新智元報道

      編輯:艾倫

      【新智元導讀】百川發布并開源全球最強醫療模型 Baichuan-M3,各項指標均已 SOTA!同時 M3 也超越了人類醫生的平均水平。它最大的進步是告別了機械的「背醫書」,學會了像真人醫生一樣主動追問、排查病因,主打「嚴肅問診」,不僅能把模糊的病情問清楚,更解決了 AI「胡說八道」的頑疾,準確度超越 GPT-5.2-High。這是 AI 從「聊天機器人」向「專業醫生」進化的關鍵一步。AI醫療,奇點已至。

      在很長一段時間里,人們習慣了這樣一種人機交互:你在搜索框或聊天窗口輸入「頭痛怎么辦?」,屏幕對面會瞬間拋回幾千字關于腦瘤、高血壓或頸椎病的百科知識,最后附上一句正確的廢話——「建議您及時就醫」。

      這不僅是搜索引擎時代的頑疾,也是目前大模型的通病。

      它們像是一個博聞強記但缺乏臨床經驗的醫學生,背下了所有醫書,卻不懂得如何面對一個活生生的人。

      就在今天,這個僵局要被打破了。

      百川智能發布并開源了新一代醫療增強大語言模型 Baichuan-M3。

      在百川創始人王小川看來,這絕非僅僅是模型參數的升級,更是一次對「AI 醫療」的重新定義。

      M3 不再滿足于做一個被動的答題者,它試圖掌握一種人類醫生最核心的職業本能——嚴肅問診。

      數據顯示,Baichuan-M3 在全球權威醫療 AI 評測 HealthBench 及其高難度子集 HealthBench Hard 上雙雙奪冠!


      甚至在 OpenAI 最引以為傲的低幻覺領域,Baichuan-M3 也以 3.5% 的幻覺率擊敗了 GPT-5.2,實現全面 SOTA!


      真正的變化體現在「百小應」App 里:當患者描述模糊的癥狀時,AI 不再急于給出結論,而是像一位經驗豐富的老大夫一樣,開始了一場抽絲剝繭的「偵探游戲」。


      百小應網頁端:https://ying.baichuan-ai.com/chat

      從「被動答題」

      到「主動追問」

      醫療的本質,是信息不對稱的博弈。

      患者往往無法準確描述自己的痛苦,「肚子疼」在醫學上可能對應著從胃痙攣到急性胰腺炎等數十種可能。

      之前,大多數醫療大模型的訓練邏輯是「完形填空」——盡力補全用戶話語中的缺失。

      OpenAI 發布的 HealthBench 評測集,本質上考查的也是這種「單輪靜態問答」能力。

      然而,百川的技術團隊發現,這種邏輯在真實臨床中是危險的。

      醫生看病,第一件事永遠是排除危急重癥。

      但在傳統的提示詞工程下,AI 往往因為急于表現「博學」,而忽略了對「紅旗征」(指危險信號)的排查。

      Baichuan-M3 的核心突破,在于它首次具備了原生的「端到端」嚴肅問診能力。

      這種能力源于百川獨創的 SCAN 全新問診原則。

      在百小應的實際體驗中,如果用戶說「頭暈」,M3 不會立刻列舉頭暈的原因,而是會啟動一套縝密的追問邏輯:

      • 安全分層(Safety Stratification):「是一陣一陣的暈,還是天旋地轉?有沒有伴隨惡心嘔吐?」(排查中風或耳石癥風險)

      • 信息澄清(Clarity Matters):「最近有沒有熬夜或測量過血壓?」(量化誘因)

      • 關聯追問(Association & Inquiry):基于初步回答,像偵探一樣鎖定嫌疑病因。

      在以往,長輪次的對話訓練容易讓模型「迷路」,導致邏輯破碎。

      百川新的SPAR 算法通過分步懲罰機制,讓 AI 學會了在有限的對話輪次中,精準地問出最關鍵的信息。

      在百小應上,這意味著 AI 能將患者口中「有點痛」、「不舒服」等主觀體感,轉化為醫生看得懂的、結構化的臨床數據。

      攻克「AI 的痼疾」:幻覺

      如果說「不會問診」只是讓 AI 顯得笨拙,那么「幻覺」則意味著安全風險。

      在嚴肅醫療場景下,大模型一本正經地胡說八道(即 AI 幻覺)是不可接受的。

      2025 年,盡管 DeepSeek 等國產模型讓 AI 普及到了千家萬戶,但大多數通用模型公司并未將「降幻覺」提升到與寫代碼、做數學題同等的高度。

      百川選擇了一條更難的路:將醫療幻覺抑制前移。

      不同于行業通用的「外掛知識庫」(RAG)模式,Baichuan-M3 試圖從「基因」里剔除幻覺。

      技術團隊構建了一套事實感知強化學習(Fact-Aware RL)架構。


      簡單來說,就是在模型訓練的每一次獎懲中,都加入對醫學事實的嚴苛校驗。

      這相當于在 AI 的大腦里植入了一個實時的「審稿人」。

      當模型試圖為了讓答案看起來通順而編造一個藥物劑量時,懲罰機制會立刻介入。

      這種「內化」的訓練方法效果顯著。

      在不依賴任何外部搜索工具的情況下,M3 的醫療幻覺率降至 3.5%!

      這一數據不僅優于 GPT-5.2,更是刷新了全球的最好成績。

      對于百小應的用戶來說,這意味著 AI 給出的每一條建議,是基于嚴謹醫學邏輯的「負責任表達」。

      在遇到自身知識邊界外的復雜病例時,M3 更傾向于引導就醫,而不是盲目自信地開方。

      誰來給「AI 醫生」監考?

      如何評價一個醫生的水平?看他背了多少書,還是看他治好了多少人?

      過去,以 HealthBench 為代表的評測集,更像是醫學院的筆試題。

      它考核的是 AI「會不會回答問題」。

      但在百川看來,這遠遠不夠。

      臨床如戰場,醫生面對的是動態的、混亂的、信息不全的真實世界。

      醫療模型必須要能夠帶著診療目標,完整的收集患者信息。

      為了給 M3 一場真正的「臨床大考」,百川聯合 150 多位一線醫生,借鑒醫學教育中經典的 OSCE(客觀結構化臨床考試)方法,搭建了 SCAN-bench 評測體系。

      這是一個包含病史采集、輔助檢查、精準診斷全流程的動態考場。

      AI 不僅要答對最后的病名,還要被考核「問診思路是否清晰」、「檢查開得是否合理」、「有沒有漏掉高危風險」。

      在實驗過程中百川發現,問診準確度每增加 2%,最終診療結果的準確度就會提升 1%。評測結果顯示,M3 在SCAN的四個維度均顯著高于人類醫生基線水平,并大幅領先于國內外頂尖模型。


      分數超越人類醫生平均值并非意味著 AI 已經全面超越了名醫,但在標準化的問診流程、知識的廣度以及對指南的絕對遵循上,AI 展現出了人類難以比擬的穩定性。

      醫療 AI 的「最后一公里」

      技術的高低,最終要落回到具體的應用場景中。

      隨著 M3 的發布,百川智能旗下的醫療應用「百小應」正在經歷一場靜悄悄的質變。

      在過去,患者去醫院就像是一場「盲盒游戲」。

      排隊三小時,看病三分鐘,面對醫生時語無倫次,把關鍵病史忘得一干二凈。

      而接入 M3 后的百小應,正在試圖成為醫患之間的「翻譯官」。

      在患者端,它是一個 24 小時在線的「全科醫生助理」。

      當你感到不適,它通過多輪專業的追問,幫你理清病情,生成一份專業的病情摘要。

      在醫生端,這可能意味著工作流的重塑。

      當患者坐到診室時,醫生看到的將會是一份已經排除了基礎風險、羅列了關鍵癥狀的結構化報告。

      醫生可以跳過機械的信息收集環節,直接進入高價值的診斷與治療決策。

      這就是百川強調的「強推理、低幻覺的醫療服務能力」的真實落地。

      它不試圖取代醫生,而是試圖通過提升問診能力、準確性,來幫助醫生決策。

      披荊斬棘的 AI 醫療先鋒

      2026 年初,全球 AI 醫療的競爭已進入深水區。

      從 OpenAI 的 ChatGPT Health 到 Anthropic 的 Claude for Healthcare,巨頭們都在爭奪這塊最難啃的骨頭。

      在這場競速中,Baichuan-M3 的出現具有特殊的標本意義。

      它標志著中國 AI 醫療從「跟隨者」轉身為「定義者」。

      百川證明了,通過對醫療決策過程的深度建模,大模型可以走出「聊天機器人」的舒適區,進入嚴肅、嚴謹且充滿敬畏的臨床世界。

      技術是冰冷的,但醫療永遠關乎人性的溫度。

      AI 無法替代醫生握住患者顫抖的手,但它可以讓醫生在握手之前,看得更清楚、判得更準確。

      針對人口老齡化,AI 是最靠譜的解決優質醫療資源短缺的幾乎唯一的方案。

      百川作為國內最早一批開始探索 AI 醫療的公司,在迷霧中努力探索出一條可落地的 AI 賦能醫療的道路。

      參考資料:

      百川開源全球最強醫療大模型M3,「嚴肅問診」定義AI醫療新能力

      百小應網頁端:https://ying.baichuan-ai.com/chat

      開源鏈接:

      Hugging Face 地址:

      https://huggingface.co/baichuan-inc/Baichuan-M3-235B

      GitHub 地址:

      https://github.com/baichuan-inc/Baichuan-M3-235B


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      連巴鐵都不敢想!印媒:丹麥或將向中國購買殲-20!

      連巴鐵都不敢想!印媒:丹麥或將向中國購買殲-20!

      52赫茲實驗室
      2026-01-24 17:20:57
      韓媒:孫興慜等球星退役后,韓國足球可能會漸漸淪為亞洲二流

      韓媒:孫興慜等球星退役后,韓國足球可能會漸漸淪為亞洲二流

      懂球帝
      2026-01-24 14:49:26
      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      霹靂炮
      2026-01-19 22:24:13
      大米江湖的暗戰:那些超市里的“陷阱米”,正在偷走你的錢和健康

      大米江湖的暗戰:那些超市里的“陷阱米”,正在偷走你的錢和健康

      富貴說
      2026-01-18 20:36:10
      達沃斯現場,特朗普瘋狂污蔑我國,不到24小時,我外交部回應亮了

      達沃斯現場,特朗普瘋狂污蔑我國,不到24小時,我外交部回應亮了

      梁訊
      2026-01-24 05:55:46
      官方公示:谷愛凌將代表中國參加米蘭冬奧會!她去年收入1.6億元,99%來自賽場外,剛拿下世界杯個人第20冠

      官方公示:谷愛凌將代表中國參加米蘭冬奧會!她去年收入1.6億元,99%來自賽場外,剛拿下世界杯個人第20冠

      每日經濟新聞
      2026-01-23 18:30:08
      韓媒不尊重中國隊,亂排4強位置,球迷:今晚一過韓媒又得改標題了

      韓媒不尊重中國隊,亂排4強位置,球迷:今晚一過韓媒又得改標題了

      側身凌空斬
      2026-01-24 11:14:03
      “都吃成碳水臉了!”三男孩寶媽,做了一桌子素菜卻嫌孩子吃的多

      “都吃成碳水臉了!”三男孩寶媽,做了一桌子素菜卻嫌孩子吃的多

      林林先生
      2026-01-23 18:29:23
      留學圈黑話“三通一達”火了,陪讀媽媽風評反轉,賠了夫人又損女

      留學圈黑話“三通一達”火了,陪讀媽媽風評反轉,賠了夫人又損女

      妍妍教育日記
      2026-01-23 19:20:29
      加拿大外長:將繼續致力于推動加沙地帶實現和平

      加拿大外長:將繼續致力于推動加沙地帶實現和平

      界面新聞
      2026-01-24 11:23:49
      江蘇昆山一工廠春節提前離崗或延遲到崗的均按自動離職處理

      江蘇昆山一工廠春節提前離崗或延遲到崗的均按自動離職處理

      搗蛋窩
      2026-01-23 08:44:18
      一個歐洲等于五個中國!特朗普急了,警告不許學北京,否則就報復

      一個歐洲等于五個中國!特朗普急了,警告不許學北京,否則就報復

      趣文說娛
      2026-01-24 17:00:13
      “我要回國禍害人了”!澳洲女留學生在外網興致勃勃的宣布!

      “我要回國禍害人了”!澳洲女留學生在外網興致勃勃的宣布!

      達文西看世界
      2026-01-23 20:28:45
      比亞迪國內銷量驟減30萬,問題究竟出在哪

      比亞迪國內銷量驟減30萬,問題究竟出在哪

      新能源前瞻
      2026-01-21 19:49:40
      《人民日報》:70%的病跟情緒有關!很多人被親人給慢性折磨死的

      《人民日報》:70%的病跟情緒有關!很多人被親人給慢性折磨死的

      詩詞中國
      2026-01-23 18:47:36
      從湖北“毒蔬菜”到云南“毒紅薯”,大量違禁農藥正摧毀國人健康

      從湖北“毒蔬菜”到云南“毒紅薯”,大量違禁農藥正摧毀國人健康

      微評社
      2026-01-23 13:30:54
      范元甄:曾是紅極一時的“延安四美”,卻因“太聰明”輸掉了一生

      范元甄:曾是紅極一時的“延安四美”,卻因“太聰明”輸掉了一生

      干史人
      2026-01-23 11:48:39
      米體:路易斯-恩里克糟糕透頂,國米每次首發上他純屬無奈

      米體:路易斯-恩里克糟糕透頂,國米每次首發上他純屬無奈

      懂球帝
      2026-01-24 16:30:07
      永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

      永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

      深度報
      2026-01-21 21:25:16
      503票贊成9票反對,歐洲通過決議,要求釋放黎智英,中方反將一軍

      503票贊成9票反對,歐洲通過決議,要求釋放黎智英,中方反將一軍

      科普100克克
      2026-01-23 17:52:43
      2026-01-24 17:48:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14400文章數 66527關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      男子就醫從尿道取出圓筒狀、筆芯狀異物 存留長達20年

      頭條要聞

      男子就醫從尿道取出圓筒狀、筆芯狀異物 存留長達20年

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      旅游
      本地
      房產
      健康
      公開課

      旅游要聞

      “我們的節日——歡歡喜喜過大年” 2026春節主題文化和旅游活動即將啟幕,帶你一站式樂享皖韻新年

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      房產要聞

      正式官宣!三亞又一所名校要來了!

      耳石脫落為何讓人天旋地轉+惡心?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 湘西| 国产无码8页| 亚洲免费三区| 美女被张开双腿日出白浆| 91色在线视频| 中文字幕日本人妻| 日本欧美大码a在线观看| 青青草原网站在线观看| 久久久av波多野一区二区| 女同性αV亚洲女同志| 亚洲一区二区三区成人网站| 国产熟妇与子伦hd| 爆乳美女午夜福利视频| 久久夜色撩人精品国产小说 | 亚洲小色网| 日韩AV无遮挡污污在线播放| 国产欧美日韩免费看AⅤ视频| 国产黄拍| 日产国产精品亚洲系列| 国产人人干| 人妻系列无码专区免费| 在线观看国产一区亚洲bd| 亚洲综合精品第一页| 久久亚洲精品成人无码网站 | 会理县| 四虎av永久在线精品免费观看| 亚洲欧洲制服| 成人九九| 精品黑人一区二区三区国语馆| 少妇洁白无删减版178txt| 无码AV中文字幕久久专区| 国产乱码精品一区二三| 日韩无码一区二区三区四区 | 制服丝袜无码视频| 亚洲综合一二| jizz免费| 蜜臀AV一区二区三区有限公司| 国产精品人成视频免费播放| 7777精品久久久大香线蕉| 狠狠色狠狠综合久久| 漂亮人妻洗澡被强bd中文|