<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      柳葉刀子刊:評估AI預測模型性能的幾大類指標總結(區分度、校準度…)

      0
      分享至

      2025年12月,《Lancet Digital Health》發表了一篇總結文章“Evaluation of performance measures in predictive artificial intelligence models to support medical decisions: overview and guidance”,對評估AI預測模型性能的幾大類指標進行了評估。文章討論了五大性能維度的32種性能指標及其圖形化評估方法,這五個維度包括:

      1)區分度(discrimination)

      2)校準度(calibration)

      3)整體性能(overall performance)

      4)分類(classification)

      5)臨床效用(clinical utility)

      其中,前四個維度反映統計性能,第五個維度則體現決策分析性能。

      文章以ADNEX模型為例來講解這些指標及其特性(該模型用于預測女性卵巢腫瘤的惡性概率)。文章建議以下指標和圖表應作為AI預測模型報告中的核心內容:受試者工作特征曲線下面積(AUC-ROC)、校準圖(calibration plot)、基于決策曲線分析的臨床效用指標(如凈收益[net benefit])、按結局類別展示的概率分布圖。

      五大性能維度

      1、區分度(discrimination)

      區分度關注模型是否能為實際發生事件的個體比未發生事件的個體分配更高的事件概率。區分度反映的是相對性能,即模型所估計的概率絕對值大小并不重要,關鍵在于這些概率能否有效區分有事件個體與無事件個體

      2、校準度(calibration)

      校準度關注模型估計的概率與實際觀察到的事件發生率之間的一致性。校準度體現的是絕對性能,用于評估概率估計值是否過高或過低。因此,一個模型可能具有良好的區分度但校準度較差,反之亦然。

      3、整體性能(overall performance)

      整體性能綜合了區分度與校準度,通過量化模型估計的概率與真實結局(0表示無事件,1表示事件)之間的接近程度,來評估模型表現。

      4、分類(classification)

      第四和第五個性能維度需要設定一個事件風險的閾值,將個體劃分為兩個互斥的組別低風險組(估計風險低于閾值)和高風險組(估計風險等于或高于閾值)。這種分組通常關聯著某種干預措施(例如手術),即建議對高風險個體實施干預,對低風險個體則不建議干預。因此,該閾值可稱為“決策閾值”。也可以使用多個決策閾值將個體劃分為三個或更多組別,本文聚焦于常見的單閾值情形。

      分類性能關注個體被正確歸類為高風險或低風險的程度。該維度基于列聯表(又稱混淆矩陣),對分類結果(低風險 vs. 高風險)與實際結局(事件 vs. 無事件)進行交叉匯總。當所有發生事件的個體預測概率均高于決策閾值,所有未發生事件的個體預測概率均低于該閾值時,分類性能達到完美。分類性能受區分度和校準度的影響

      5、臨床效用(clinical utility)

      臨床效用更進一步,在評估個體被劃分進低風險或高風險組時,明確考慮了誤分類成本(misclassification costs)。"誤分類成本"是一個成熟術語,泛指各類誤分類(包括假陽性與假陰性)所帶來的危害。

      臨床效用評估的是基于特定決策閾值所做決策的質量,以及使用該模型是否比不使用模型或使用其他競爭模型能帶來更優的臨床決策。因此,決策閾值應具有臨床意義,并與誤分類成本相關聯。由于臨床效用直接關注決策質量,它是五個性能維度中最重要的一個

      “決策閾值”的定義

      大多數用于醫學的預測性AI模型,主要目標是支持后續的臨床決策。模型得到的概率估計值可幫助改善健康結局:對低風險個體避免實施獲益有限且負擔較重的干預措施,為高風險個體更合理地選擇干預方案。因此,決策閾值應基于醫學考量而非統計學依據來確定

      然而,在實踐中,決策閾值常常通過某個統計指標來定(如約登指數,即靈敏度+特異度?1)。采用統計學指標來設定決策閾值,不僅違背決策理論的基本原則,也脫離了臨床醫生的實際使用需求

      正確的做法是:一旦模型所要支持的具體臨床決策被明確定義后,就應考慮使用該模型輔助決策可能產生的四種后果:

      • 真陽性(實際發生事件且被歸類為高風險)
      • 真陰性(未發生事件且被歸類為低風險)
      • 假陰性(實際發生事件卻被歸類為低風險)
      • 假陽性(未發生事件卻被歸類為高風險)

      這些后果的重要性權重因干預措施的性質與影響、醫療體系特點,以及醫生和患者的偏好而有所不同

      本文中的案例涉及需要手術切除卵巢腫瘤的患者。臨床使用ADNEX模型來決定應采取高級別手術還是保守手術,通常建議將惡性概率的決策閾值設為0.1(即10%)。這意味著,當ADNEX模型預測某患者的惡性風險為10%時,便建議其接受高級別手術。在此閾值下,每發現1例真正需要高級別手術的惡性腫瘤患者(真陽性),就需要對另外9名實際為良性腫瘤的患者實施了不必要的高級別手術(即最多接受9例假陽性)。換言之,采用這一閾值隱含的前提是:對惡性腫瘤患者實施高級別手術所帶來的醫學獲益,至少是良性腫瘤患者接受不必要高級別手術所造成傷害的9倍。

      本文討論了32種性能指標(3種區分度指標、6種校準度指標、9種整體性能指標、11種分類指標、3種臨床效用指標)(見表1),以及相應的可視化評估方法。

      表1. 本文所討論的性能指標以及案例研究中ADNEX模型在校準前后的結果






      良好性能指標應具備的關鍵特征

      本文定義了性能指標應具備的兩項關鍵特征:(1)該指標應為“恰當”(proper)的指標;(2)該指標應明確聚焦于是反映統計價值還是決策分析價值。不具備第一項特征的指標不可信賴,缺乏第二項特征的指標則含義模糊、難以解釋。

      第三項理想特征是具有直觀易懂的可解釋性,但本文不詳細討論這一特征,因為可解釋性具有主觀性,且受使用者背景知識和熟悉程度的影響。

      在醫學實踐中,對預測性AI模型的性能評估可清晰區分為統計性能評估決策分析性能評估兩類。前四個性能維度關注統計性能的不同方面,而臨床效用維度則聚焦于決策分析性能。

      統計性能指標對于模型評估至關重要,但不能單獨用于判斷模型是否應投入臨床實踐。例如,僅憑良好的區分度和校準度就聲稱“該模型可用于輔助卵巢手術決策”是不恰當的。若某性能指標旨在超越單純的統計價值,則必須依據決策分析原則,要納入誤分類成本。

      案例研究:卵巢癌診斷模型(ADNEX模型)

      本文所使用的案例是對有卵巢腫瘤的女性預期其惡性風險。ADNEX模型由國際卵巢腫瘤分析(IOTA)聯盟開發,可在術前估計計劃接受手術的卵巢腫瘤患者患惡性腫瘤的概率[1]。該模型可用于指導兩類決策:(1)在腫瘤中心就診的患者選擇高級別手術還是保守手術;(2)在其他機構就診的患者是否應轉診至腫瘤中心。

      ADNEX模型基于1999-2012年間來自10個國家(意大利、比利時、瑞典、捷克、波蘭、法國、英國、中國、西班牙、加拿大)的24家二級和三級醫療機構共5909名患者的數據開發而成。

      隨后,TransIOTA研究利用2015-2019年間來自4個國家(比利時、意大利、捷克和英國)的1家二級和5家三級醫療機構的894名女性數據,對ADNEX模型區分良性與惡性腫瘤的能力進行了外部驗證[2]。

      出于教學目的,本文使用該數據集計算了所有要討論的性能指標及其95%CI,并展示了所有相關的可視化圖表。

      本文評估了原始ADNEX模型的性能,以及經邏輯校準(logistic recalibration)更新后的性能(見前表1)。更新方法為:以結局為因變量,以ADNEX輸出的事件概率的logit值(線性預測因子)為自變量,擬合一個logistic回歸模型。該方法類似于機器學習中的Platt縮放(Platt scaling),常用于改善預測的校準度。邏輯校準本質上是對線性預測因子進行線性變換,因此是一種保序方法(rank-preserving method),即患者按惡性概率排序的結果在校準前后保持不變。

      所有R和Python代碼,以及894名參與者的惡性風險估計值和實際結局數據,均已公開于GitHub代碼倉庫,鏈接如下:

      https://github.com/benvancalster/PerfMeasuresOverview

      參考文獻:

      1.BMJ. 2014; 349:g5920

      2. Br J Cancer. 2024; 130:934-940

      本文整理自:Lancet Digit Health. 2025 Dec 13:100916.

      受篇幅限制,本篇文章先介紹到這里,在后面一篇推文中,我們再介紹這篇文章的后半部分,即針對各種性能指標的描述以及相應的可視化方法,敬請期待。


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      洗米華大女兒碩士畢業,一家人拍畢業照,洗米嫂戴鉆戒出鏡

      洗米華大女兒碩士畢業,一家人拍畢業照,洗米嫂戴鉆戒出鏡

      素素娛樂
      2026-01-23 11:07:53
      強陣沖首冠!U23國足VS日本首發:向余望連場先發,拜合拉木替補

      強陣沖首冠!U23國足VS日本首發:向余望連場先發,拜合拉木替補

      我愛英超
      2026-01-24 21:37:03
      白宮發布特朗普與企鵝走向格陵蘭島AI圖片!丹麥國防部稱“北極耐力”軍演將持續到2026年底

      白宮發布特朗普與企鵝走向格陵蘭島AI圖片!丹麥國防部稱“北極耐力”軍演將持續到2026年底

      每日經濟新聞
      2026-01-24 13:18:06
      童錦程不配合,孩子還沒辦出生證明,女方自曝美照后,輿論反轉了

      童錦程不配合,孩子還沒辦出生證明,女方自曝美照后,輿論反轉了

      非常先生看娛樂
      2026-01-23 17:54:48
      特朗普通告全球,不許減持美國國債;中方還剩6830億,游戲已結束

      特朗普通告全球,不許減持美國國債;中方還剩6830億,游戲已結束

      影孖看世界
      2026-01-23 23:49:11
      U23國足獲得亞洲杯亞軍,知名解說員黃健翔:球迷應該記住這支球隊,別用勝負綁架他們的成長

      U23國足獲得亞洲杯亞軍,知名解說員黃健翔:球迷應該記住這支球隊,別用勝負綁架他們的成長

      極目新聞
      2026-01-25 01:26:36
      《人民日報》:70%的病跟情緒有關!很多人被親人給慢性折磨死的

      《人民日報》:70%的病跟情緒有關!很多人被親人給慢性折磨死的

      詩詞中國
      2026-01-23 18:47:36
      善惡終有報!靠星光大道成名的“盲人”楊光,終要為自己荒唐買單

      善惡終有報!靠星光大道成名的“盲人”楊光,終要為自己荒唐買單

      小熊侃史
      2026-01-23 11:01:14
      “和平委員會”最終成員名單出來了,4國突然變卦反悔!

      “和平委員會”最終成員名單出來了,4國突然變卦反悔!

      愛吃醋的貓咪
      2026-01-23 20:25:06
      馮小剛養女徐朵曬家中日常,別墅寬敞卻樸素,夫妻倆寵溺藏不住

      馮小剛養女徐朵曬家中日常,別墅寬敞卻樸素,夫妻倆寵溺藏不住

      驕陽之夏明
      2026-01-24 19:37:45
      20歲浙江獨生女泰國留學25天遭撕票!兇手是3名同胞,男友是主謀

      20歲浙江獨生女泰國留學25天遭撕票!兇手是3名同胞,男友是主謀

      一盅情懷
      2026-01-24 17:01:22
      看不上?日本人毫不關心決賽:保持一副玩的態度 網站無相關報道

      看不上?日本人毫不關心決賽:保持一副玩的態度 網站無相關報道

      風過鄉
      2026-01-24 10:06:49
      離開皇馬是對的!9次過人幫助球隊致勝,想去世界杯的他機會來了

      離開皇馬是對的!9次過人幫助球隊致勝,想去世界杯的他機會來了

      里芃芃體育
      2026-01-24 03:00:03
      后悔嗎?被老頭“白嫖”10年,還倒貼上億,59歲不婚不育的李若彤

      后悔嗎?被老頭“白嫖”10年,還倒貼上億,59歲不婚不育的李若彤

      TVB的四小花
      2026-01-25 01:26:04
      外媒:丹麥將因格陵蘭問題向中國尋求殲-20!

      外媒:丹麥將因格陵蘭問題向中國尋求殲-20!

      達文西看世界
      2026-01-24 20:53:57
      中國芯片英雄,被美國囚禁9年后終于回家!他反手把蘋果告上法庭

      中國芯片英雄,被美國囚禁9年后終于回家!他反手把蘋果告上法庭

      胖哥不胡說
      2026-01-24 18:45:24
      U23國足噩夢開局!6戰首次丟球,李昊無能為力,彭嘯太郁悶

      U23國足噩夢開局!6戰首次丟球,李昊無能為力,彭嘯太郁悶

      奧拜爾
      2026-01-24 23:17:06
      王鈺棟失誤致丟球!記者感慨:最好的球員之一,把球停出了幾米遠

      王鈺棟失誤致丟球!記者感慨:最好的球員之一,把球停出了幾米遠

      林子說事
      2026-01-24 23:54:01
      被雪豹咬傷女子已從急診轉至其他科室,目擊者稱“當事人沒有去摸豹子”,專家:雪豹當時或在“應激”狀態

      被雪豹咬傷女子已從急診轉至其他科室,目擊者稱“當事人沒有去摸豹子”,專家:雪豹當時或在“應激”狀態

      大風新聞
      2026-01-24 20:38:09
      中國移動:重磅合并重組啟動!

      中國移動:重磅合并重組啟動!

      環球通信
      2026-01-24 11:48:01
      2026-01-25 02:03:00
      醫咖會
      醫咖會
      生動有趣的形式傳遞醫學新進展
      2736文章數 10969關注度
      往期回顧 全部

      科技要聞

      黃仁勛現身上海菜市場

      頭條要聞

      張又俠、劉振立被查 解放軍報發布社論

      頭條要聞

      張又俠、劉振立被查 解放軍報發布社論

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      回歸還是頂流 鳳凰傳奇將現身馬年春晚

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      旅游
      教育
      藝術
      公開課
      軍事航空

      旅游要聞

      2026重慶園博園大型水上燈會沖刺布展,新春光影盛宴即將啟幕!

      教育要聞

      一小學強制老師排練年會節目被投訴,投訴人:熬夜排練,身心俱疲,教育局回應

      藝術要聞

      634米!世界第一高塔:東京晴空塔建設紀實

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄美烏首次三方會談在阿聯酋舉行

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 内射极品人妻| 人妻自拍网| 国产一级片内射在线视频| 免费99精品国产自在现线| 男人靠女人免费视频网站| 惠州市| 麻豆av一区二区天美传媒| 91肉丝| 曾医生17分钟??下载| 欧美色熟妇| 久久涩综合一区二区三区 | 五十路丰满中年熟女中出| 国产AV中文字幕| 国产第一页屁屁影院| 松下纱荣子被c到高潮下不了床| 日本99视频| 亚洲激情av| 永久黄网站色视频免费直播| 国产一区国产精品自拍| av免费网站在线免费观看| 国产一码二码三码区别| 日韩欧美亚洲综合久久| 亚洲AV电影在线观看| 国产偷人妻精品一区二区在线| 精品国产免费一区二区三区香蕉| 石河子市| 欧美激情a∨在线视频播放| 久久99精品国产| 国产麻豆剧传媒精品国产av| 欧美A级视频| 亚洲精品一二三| 日韩电影精品| 成人另类小说| 97人妻免费公开视频| 国产97色在线| 蜜桃视频在线播放| 午夜无码区在线观看| 国产精品天干天干综合网| 日韩AV高清在线看片| 思思99热精品在线| 国产超碰无码最新上传|