<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      解放軍總醫院聯合南大、吉大等機構,提出首個「脊柱診療大模型」

      0
      分享至



      本研究由解放軍總醫院牽頭,聯合浙江大學醫學院附屬第二醫院、復旦大學附屬華山醫院等共 11 家國內頂尖三甲醫院,攜手南京大學、吉林大學兩所重點高校,并匯聚 Pi3Lab、上海三友醫療器械股份有限公司等產學研多方力量,共同完成了首個面向脊柱診療領域的大模型研發。

      論文共同第一作者包括趙明、董文輝博士、張陽醫生,核心貢獻者包括來自浙江大學醫學院附屬第二醫院的陳其昕教授、夏順楷醫生,以及復旦大學附屬華山醫院的馬曉生教授、管韻致醫生等。通訊作者為解放軍總醫院骨科醫學部副主任孫天勝教授,共同通訊作者為南京大學智能科學與技術副院長單彩峰教授。

      脊柱疾病影響全球 6.19 億人,是致殘的主要原因之一 。然而,現有 AI 模型在臨床決策中仍存在「認知鴻溝」。缺乏椎體級別(level-aware)、多模態融合的指令數據和標準化基準,是制約 AI 輔助診斷的關鍵瓶頸。

      本文提出了一套統性的解決方案,包括首個大規模、具有可追溯性的脊柱指令數據集 SpineMed-450K,以及臨床級評測基準 SpineBench。基于此訓練出的專科大模型 SpineGPT,在所有任務上均實現了顯著提升,僅僅 7B 參數量,全面超越了包括 GLM-4.5V 和 Qwen2.5-VL-72B 在內的頂尖開源大模型 。



      • 論文地址:https://arxiv.org/pdf/2510.03160

      臨床痛點:通用 LVLM 的「認知鴻溝」

      脊柱疾病的臨床診療,需要復雜的推理過程:整合 X 光、CT、MRI 等多模態影像的發現,并將病灶精確定位到特定的椎體層面(Level-Aware Reasoning),以確定嚴重程度并規劃干預措施 。這種集成推理能力,是現有通用視覺 - 語言大模型(LVLMs)的系統性弱點 。

      在 SpineBench 的評測中,這一弱點暴露無遺 :



      • 性能差距明顯:即使是參數量達 72B 的 Qwen2.5-VL-72B,平均性能也僅為 79.88%。領先的開源模型 GLM-4.5V (83.26%) 與頂尖專有模型 Gemini-2.5-Pro (89.23%) 之間仍存在近6 個百分點的差距。在醫療報告生成任務中,更是差距明顯,Qwen2.5VL-72B 和 Gemini-2.5-pro 差 30%。
      • 跨模態對齊缺陷:幾乎所有模型在多模態任務上的性能都有不同程度的下降 。例如,GPT5 在純文本 QA (87.41%) 與圖像 QA (79.97%) 之間的差距高達7.44 個百分點 。這反映了現有模型在醫學圖像理解和視覺 - 語言對齊上的根本不足,限制了它們在需要綜合分析圖像和文本的臨床場景中的應用。

      核心成果:構建臨床級 AI 的「基礎設施」

      為填補現有數據與臨床需求之間的認知鴻溝,研究團隊與實踐中的脊柱外科醫生共同設計和構建了 SpineMed 生態系統。

      1. SpineMed-450K:椎體級、多模態指令數據集

      這是首個明確為椎體級推理而設計的大規模數據集。



      • 規模與來源:包含超過 450,000 條指令實例。數據來源極其豐富,包括教科書、外科指南、專家共識、開放數據集(如 Spark、VerSe 20202020),以及約 1,000 例去識別化的多模態醫院真實病例。真實病例來源于國內 11 家知名醫院,確保了患者來源的多樣性 。
      • 生成管線:數據生成采用了嚴謹的「臨床醫生介入」(Clinician-in-the-loop)流程。該流程涉及:

      ——使用 PaddleOCR 提取圖文信息;

      ——通過新型的圖像 - 上下文匹配算法,將圖像與其周圍的文本上下文精確綁定,保證可追溯性;

      ——利用LLM 兩階段生成方法(起草和修訂)來生成高質量的指令數據,且臨床醫生參與了提示詞策略和修訂標準的審查。



      • 任務多樣性:涵蓋四種類型——多項選擇 QA(249k)、開放式 QA(197k)、多輪診療對話(1.1k)和臨床報告生成(821 例)。數據覆蓋七個骨科亞專科,其中脊柱外科數據占比 47%,并細分為 14 種脊柱亞疾病。



      2. SpineBench:首個臨床顯著性評估基準

      SpineBench 是一個與臨床深度結合的評估框架,旨在評估 AI 在細粒度、以解剖為中心的推理中犯下的、在實踐中至關重要的錯誤類型。

      • 基準構成:最終包含 487 道高質量多項選擇題和 87 個報告生成提示 。
      • 嚴謹驗證:為確保評估集的完整性,由17 名骨科外科醫生組成的團隊,分成三個獨立小組進行了嚴格的驗證和校正。
      • 報告評估:針對臨床報告生成任務,設計了由專家校準的框架。評估從五大板塊、十個維度進行:

      1. 結構化影像報告(SIP):評估發現的準確性、臨床意義和定量描述 。
      2. AI 輔助診斷(AAD):評估主要診斷的正確性、鑒別診斷和臨床推理 。
      3. 治療建議(TR):分為患者指導(語言清晰度、共情、安撫)、循證計劃(理由、指南一致性)和技術可行性(手術細節、并發癥預防)。
      4. 風險與預后評估(RPM):評估圍手術期管理、隨訪安排和潛在問題策略 。
      5. 推理與免責聲明(RD):評估證據覆蓋范圍、相關性、細節粒度和邏輯連貫性。



      實驗結果:專科 AI 模型 SpineGPT 的突破性表現

      SpineGPT 基于 Qwen2.5-VL-7B-Instruct 模型,通過課程學習(Curriculum Learning)框架,分三階段在 SpineMed-450K 上進行微調,以逐步增強其在脊柱健康領域的適用性和專業性 。



      1.超越開源,逼近頂尖專有模型:SpineGPT 達到了87.44%的平均分,大幅領先所有開源大模型 4.18 個百分點以上。在純文本 QA 任務上(89.46%),SpineGPT 甚至超越了所有參評模型,包括 GPT5 (87.41%) 。

      2.專科數據的重要性(消融實驗):

      • 模型僅在通用醫療數據上訓練時,性能顯著下降(74.95% vs 65.31%)。
      • 納入精心策劃的非脊柱通用骨科數據后,性能得到大幅提升(82.14% vs 74.95%),驗證了領域對齊訓練數據的重要性。
      • 最終,納入脊柱特異性訓練數據(包括對話、報告生成和長鏈推理指令)后,模型性能進一步增強至 87.89%。

      3.臨床報告能力顯著增強:SpineGPT 在醫療報告生成任務上的總分為87.24分,而 Qwen2.5-VL-72B 僅為 63.80 分,ChatGPT-4o 為 64.04 分。

      • 案例對比:在對「青少年特發性脊柱側凸」病例的分析中,SpineGPT 提供了包含 72 個詳細的臨床處理流程,涵蓋了完整的影像發現、AI 診斷、患者和醫生導向的治療建議、風險管理和術后問題管理。相比之下,ChatGPT-4o 的報告則更偏向于適合一般醫療文檔的基本診斷和治療建議。



      4.人類專家高度認可:人類專家對報告評分與 LLM 自動評分之間的Pearson 相關系數達到 0.382 至 0.949,大多數維度相關性在 0.7 以上。這有力地驗證了 LLM 自動評分作為專家判斷代理的可靠性。

      結論與展望

      這項研究證明了:對于脊柱診斷這樣需要復雜解剖推理的專業領域,專科指令數據和「臨床醫生介入」的開發流程是實現臨床級 AI 能力的關鍵。

      SpineMed-450K 和 SpineBench 的發布,為未來的 AI 研究提供了一個高實用性的基線。研究團隊計劃將拓展數據集、訓練大于 7B 參數的模型,并結合強化學習技術,繼續深化與領先專有模型的直接比較,以確立更清晰的性能基準。

      Pi3Lab 介紹

      Pi3Lab 專注于 AI Agent 的行業落地,致力于通過 RLaaS 平臺讓通用模型在實際業務中真正低成本、高效率地用起來。目前我們正在招聘 RL RA(強化學習研究助理),歡迎投遞簡歷:wenhui.dong@pi3lab.com

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      錯失主力,媒體評火箭簽下史密斯略顯著急,老鷹沃克或是更好人選

      錯失主力,媒體評火箭簽下史密斯略顯著急,老鷹沃克或是更好人選

      拾叁懂球
      2025-12-08 01:19:33
      小紅書的炫富婊到底有多Low

      小紅書的炫富婊到底有多Low

      明智家庭教育
      2025-12-05 12:24:42
      混團世界杯大結局!國乒獎金排行榜:王楚欽第一30萬,孫穎莎第4

      混團世界杯大結局!國乒獎金排行榜:王楚欽第一30萬,孫穎莎第4

      觀察鑒娛
      2025-12-08 09:16:40
      張獻忠拿下成都,在蜀王府找到明將藍玉的人皮,揭開兩百年前慘案

      張獻忠拿下成都,在蜀王府找到明將藍玉的人皮,揭開兩百年前慘案

      銘記歷史呀
      2025-12-06 18:36:19
      雷佳音:大學時陳赫瞧不起我,見面都躲著走,我農村人,就這樣

      雷佳音:大學時陳赫瞧不起我,見面都躲著走,我農村人,就這樣

      白面書誏
      2025-11-20 17:29:35
      亞洲首位男子UFC冠軍誕生!

      亞洲首位男子UFC冠軍誕生!

      格斗迷
      2025-12-07 14:22:25
      猛降近10℃,寒潮又要來了

      猛降近10℃,寒潮又要來了

      極目新聞
      2025-12-07 15:40:55
      勇士最快速度交易!庫里,狂喜!

      勇士最快速度交易!庫里,狂喜!

      小齊艱難度日
      2025-12-08 00:58:35
      愛奇藝道歉就想翻篇?2.4億熱度角色被除名,粉絲氪金成笑話!

      愛奇藝道歉就想翻篇?2.4億熱度角色被除名,粉絲氪金成笑話!

      喜歡歷史的阿繁
      2025-12-07 16:38:29
      男籃生死戰!郭士強承諾絕不退縮,新援助力戰日本!

      男籃生死戰!郭士強承諾絕不退縮,新援助力戰日本!

      魯源侃球
      2025-12-07 11:30:03
      兩岸喜訊!大陸萬萬沒想到,沒等我軍正式收臺,臺當局送“大禮”

      兩岸喜訊!大陸萬萬沒想到,沒等我軍正式收臺,臺當局送“大禮”

      瞳哥視界
      2025-12-03 21:44:15
      媒體人:國安來了一個德國的體育總監

      媒體人:國安來了一個德國的體育總監

      懂球帝
      2025-12-08 08:37:15
      卡德羅夫稱俄國防部的大規模打擊是對基輔襲擊“全面徹底”的回應

      卡德羅夫稱俄國防部的大規模打擊是對基輔襲擊“全面徹底”的回應

      俄羅斯衛星通訊社
      2025-12-07 16:08:46
      擠走徐杰+單換郭艾倫!男籃強力后衛身價大暴跌,狂逼郭士強下課

      擠走徐杰+單換郭艾倫!男籃強力后衛身價大暴跌,狂逼郭士強下課

      緋雨兒
      2025-12-07 12:18:32
      2008年北京奧運前夕,有關單位給華國鋒門票,華:我老了,不去了

      2008年北京奧運前夕,有關單位給華國鋒門票,華:我老了,不去了

      歷史甄有趣
      2025-12-07 20:35:07
      偷稅只是冰山一角!央視出手,陳震再迎噩耗,牽扯整個車評圈

      偷稅只是冰山一角!央視出手,陳震再迎噩耗,牽扯整個車評圈

      甜檸聊史
      2025-12-06 16:55:42
      鴻輝光通被暫停全軍采購資格

      鴻輝光通被暫停全軍采購資格

      齊魯壹點
      2025-12-08 06:53:39
      清朝最后一名太監回憶:妃子洗澡從不用手和避諱太監,十分侮辱人

      清朝最后一名太監回憶:妃子洗澡從不用手和避諱太監,十分侮辱人

      興趣知識
      2025-12-04 21:01:19
      要是中日真開戰,中國老百姓會不會遭殃?會,但只是小部分會

      要是中日真開戰,中國老百姓會不會遭殃?會,但只是小部分會

      我心縱橫天地間
      2025-12-05 11:25:34
      晚節不保!奚美娟丑聞曝光,現身上戲站C位,表面風光,體面盡毀

      晚節不保!奚美娟丑聞曝光,現身上戲站C位,表面風光,體面盡毀

      娛說瑜悅
      2025-12-05 15:10:54
      2025-12-08 10:16:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11862文章數 142510關注度
      往期回顧 全部

      健康要聞

      甲狀腺結節"排雷"指南

      頭條要聞

      外媒:德外長訪華 迎來政治生涯中最艱難一次出國之旅

      頭條要聞

      外媒:德外長訪華 迎來政治生涯中最艱難一次出國之旅

      體育要聞

      梅開48度!2年半,這是梅西在邁阿密的一人一城

      娛樂要聞

      林俊杰AAA頒獎禮,韓娛愛豆均站起鞠躬

      財經要聞

      養牛場未見一頭牛 每天開采礦石倒賣

      科技要聞

      獨家|李笛再創業,炮轟大模型,再戰AI

      汽車要聞

      傳奇超跑電動形態重生 雷克薩斯LFA純電概念車

      態度原創

      健康
      旅游
      房產
      親子
      公開課

      甲狀腺結節"排雷"指南

      旅游要聞

      云南騰沖:銀杏金黃入畫來

      房產要聞

      封關啟幕宜居新時代!觀嵐森嶼定義三亞旅居度假新范本

      親子要聞

      這五招讓娃主動吃飯

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久久久国产精品人妻 | 欧美、日韩、中文、制服、人妻| 人妻系列无码专区无码中出| 妇女bbbb插插插视频| 大地资源中文在线观看西瓜| 亚洲成人首页| 国产乱沈阳女人高潮乱叫老 | 盐城市| 免费国产一级 片内射老| 91视频免费入口| 国产一卡二卡在线| 郑州市| 国产美女高潮流白浆视频| 昌邑市| 苗栗市| 国产精品久久久| 久色88| 综合Av| 日韩乱码人妻无码中文字幕视频| 亚洲中文字幕无码专区| 亚洲无码黄片| 大香蕉久久综合| 老王AV| 免费观看添你到高潮视频| 无码熟妇αⅴ人妻又粗又大| 日韩色区| 一本大道东京热无码aⅴ| 高级会所人妻互换94部分 | 欧美老少配性行为| 乱码中文字幕| xxx综合网| 免费观看日本污污ww网站| 曰本久久久免费黄| 国产成人女人在线观看| 4480yy亚洲午夜私人影院剧情 | 亚洲国产另类久久久精品网站| 波多野结衣乳喷高潮视频| av在线资源| 成全世界免费高清观看| 午夜福利92国语| 极品美女aⅴ在线观看|