<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      柳葉刀子刊:評估AI預(yù)測模型性能的常見指標和可視化圖形

      0
      分享至

      2025年12月,《Lancet Digital Health》發(fā)表了一篇文章“Evaluation of performance measures in predictive artificial intelligence models to support medical decisions: overview and guidance”,對評估AI預(yù)測模型性能的幾大類指標進行了總結(jié)。

      在前一篇推文中,我們介紹了幾大類指標的概念:1)區(qū)分度(discrimination)、2)校準度(calibration)、3)整體性能(overall performance)、4)分類(classification)、5)臨床效用(clinical utility)。

      詳見:

      接下來仍以ADNEX模型為例(該模型預(yù)測女性卵巢腫瘤的惡性概率),具體聊一聊這些指標以及相應(yīng)的可視化圖形。所有R和Python代碼,均已公開于GitHub代碼倉庫,鏈接如下:

      https://github.com/benvancalster/PerfMeasuresOverview

      前文提到,性能指標應(yīng)具備兩項關(guān)鍵特征(1)該指標應(yīng)為“恰當”(proper)的指標;(2)該指標應(yīng)明確聚焦于是反映統(tǒng)計價值還是決策分析價值不具備第一項特征的指標不可信賴,缺乏第二項特征的指標則含義模糊、難以解釋。下面在討論各指標時,會提及到這兩項特征。

      區(qū)分度(Discrimination)

      常見的區(qū)分度指標是一致性概率(concordance probability)或C統(tǒng)計量(C-statistic。對于二分類結(jié)局,C統(tǒng)計量等于受試者工作特征曲線下面積(AUROC),但當事件發(fā)生率遠遠偏離0.5時,一些研究者建議不要使用AUROC。有觀點認為,在罕見事件時,AUROC具有誤導(dǎo)性或過于樂觀。

      作為ROC曲線及AUROC的替代方案,常推薦使用精確率–召回率曲線(PR曲線)及其曲線下面積(AUPRC)。另一種替代AUROC的指標是部分AUROC(pAUROC),關(guān)注ROC曲線中特異度或靈敏度達到某個最低可接受水平的部分。AUROC、AUPRC和pAUROC均為“半恰當(semi-proper)”指標。

      區(qū)分能力對預(yù)測性AI模型至關(guān)重要,但僅憑AUROC一項指標不足以判定一個模型是否優(yōu)秀或?qū)嵱?/b>。使用PR曲線或ROC曲線進行可視化展示是可以接受的,但根據(jù)本文作者的經(jīng)驗,這些圖所提供的信息并不比匯總性指標(如AUROC)或相關(guān)的臨床效用指標(如凈效益net benefit)更有價值。

      下圖1展示了本案例研究(ADNEX模型)的ROC曲線和PR曲線,基于“靈敏度低于0.8不可接受”這一觀點(但該觀點未經(jīng)證實),展示出了pAUROC。

      ADNEX模型的AUROC為0.91(95%CI 0.89–0.93),AUPRC為0.89(95%CI 0.86–0.91)。去掉靈敏度低于0.8的部分后,pAUROC為0.14(95%CI 0.13–0.15)。




      圖1. ADNEX模型的ROC曲線(A)、PR曲線(B)和pAUROC(C)

      校準度(Calibration)

      統(tǒng)計學(xué)和機器學(xué)習(xí)文獻提過多種評估模型校準度的方法,這些方法可分為三個逐級嚴格的層級:均值校準(mean calibration)、弱校準(weak calibration)、中度校準(moderate calibration),前兩個層級主要源自統(tǒng)計學(xué)文獻。目前,關(guān)于第四個層級“強校準(strong calibration)”的量化研究仍在進行中。

      均值校準(也稱“整體校準”,calibration-in-the-large)用于評估模型預(yù)測概率的均值是否等于數(shù)據(jù)集觀察到的實際事件患病率。衡量整體校準的兩個常用指標是觀察值與預(yù)期值之比(O/E ratio)和校準截距(calibration intercept)。

      在本案例中,ADNEX模型的O/E比為1.23(95%CI:1.17–1.29),表明實際觀察到的事件數(shù)比模型預(yù)期高23%。校準截距為0.81(95%CI:0.62–1.01),提示模型平均而言低估了事件發(fā)生率(截距>0)。相比校準截距,O/E比具有更直觀的解釋意義。

      當一個模型的整體校準良好,且預(yù)測概率的離散程度(即分布范圍)不過大也不過小(通過校準斜率[calibration slope]量化),該模型被認為具有弱校準。若預(yù)測概率離散度過大,其預(yù)測概率值會過于接近0或1(校準斜率<1);若離散度過小,則預(yù)測值會集中在整體患病率附近(斜率>1)。在內(nèi)部驗證中,校準斜率小于1可能提示模型存在過擬合風(fēng)險。在本案例研究中,ADNEX模型的校準斜率為0.93(95%CI:0.83–1.05),表明預(yù)測概率的離散程度基本合適。

      中度校準意味著:對于所有預(yù)測概率為x的個體,實際事件的發(fā)生率也恰好等于x。評估中度校準最常用的方法是繪制校準圖(calibration plot),也稱為可靠性圖(reliability diagram)。校準圖可通過對個體分組或使用平滑法(smoothing)生成

      圖2展示了本案例研究中使用的兩種校準圖:一種基于等量分十組,另一種采用局部加權(quán)回歸平滑法(loess)進行平滑處理。兩條曲線大部分位于對角線的上方,表明在整個預(yù)測概率范圍內(nèi),模型系統(tǒng)性低估了事件風(fēng)險。一個可能的原因是,在驗證研究的六個參與中心中,有五個是三級中心,因此惡性腫瘤的實際患病率較高。需要注意的是,分組校準圖無法全面評估中度校準,因為預(yù)測概率差異很大的個體仍可能被歸入同一組。


      圖2. ADNEX模型的校準圖

      已有研究提出了一些針對校準圖的匯總指標,例如針對分組校準圖的期望校準誤差(Expected Calibration Error, ECE),針對平滑校準圖的估計校準指數(shù)(Estimated Calibration Index, ECI)和整合校準指數(shù)(Integrated Calibration Index, ICI)。

      然而,與Hosmer–Lemeshow檢驗等統(tǒng)計學(xué)檢驗類似,這些匯總指標無法說明校準偏差方向,即模型是系統(tǒng)性高估還是低估風(fēng)險。此外,ECE、ECI和ICI的數(shù)值依賴于所采用的分組或平滑方法,并且在統(tǒng)計一致性方面存在局限性。目前,學(xué)界正在研究更優(yōu)的匯總指標。因此,包含置信區(qū)間的校準圖是評估校準性能的關(guān)鍵工具,因其能夠直觀展示在不同預(yù)測風(fēng)險水平下的校準表現(xiàn)。

      上述所有校準指標均為半恰當(semi-proper)指標,聚焦于統(tǒng)計性能。

      整體性能(Overall performance)

      整體性能的基本評估指標包括基于似然函數(shù)的指標,如對數(shù)損(logloss,也稱為交叉熵損失)以及Brier評分(Brier score)。

      通過與零模型(null model)比較來表達模型性能的指標,包括標準化Brier評分(scaled Brier score,也稱預(yù)測準確度指數(shù)),以及用于測量解釋變異比例的R2類指標,例如McFadden R2、Cox–Snell R2和Nagelkerke R2。

      較少使用的整體性能指標還包括區(qū)分度斜率(discrimination slope,也稱判別系數(shù))和平均絕對預(yù)測誤差(mean absolute prediction error,MAPE)。

      對數(shù)似然(loglikelihood)、對數(shù)損失(logloss)以及Brier評分屬于“嚴格恰當”(strictly proper)的指標;標準化Brier評分和各類R2指標屬于“漸近嚴格恰當”(asymptotically strictly proper)的指標(樣本量較大時,例如超過100,是嚴格恰當?shù)模粎^(qū)分度斜率和平均絕對預(yù)測誤差屬于不恰當(improper)的指標。上述所有整體性能指標均聚焦于統(tǒng)計性能(模型的第二個關(guān)鍵特征,見上文所述)。

      整體性能的可視化,通常是分別展示事件組和非事件組預(yù)測概率的分布情況。圖3展示了ADNEX模型的小提琴圖(violin plots):良性腫瘤患者絕大多數(shù)具有極低的惡性風(fēng)險預(yù)測概率;惡性腫瘤患者的預(yù)測概率大多處于中至較高水平,且分布更為分散。


      圖3. 基于ADNEX模型惡性風(fēng)險預(yù)測概率的小提琴圖和散點圖

      分類指標

      (Classification measures)

      本案例使用的ADNEX模型推薦的常用閾值為10%。在此閾值下,將578名患者分類為高風(fēng)險,其中414名確實患有惡性腫瘤(即真陽性),而164名實際為良性腫瘤(假陽性)。模型將剩余的316名患者分類為低風(fēng)險,其中296名患者確實為良性腫瘤(真陰性),20名實際為惡性腫瘤(假陰性)。

      分類指標分為匯總指標(summary measures)和描述性部分指標(descriptive partial measures)。常見的部分指標包括靈敏度(也稱為召回率recall)、特異度陽性預(yù)測值(PPV,也稱為精確率precision)和陰性預(yù)測值(NPV)。靈敏度和特異度是基于實際結(jié)果的分類準確性,但在預(yù)測時實際結(jié)果是未知的;PPV和NPV更具臨床相關(guān)性。匯總指標包括分類準確率平衡準確率約登指數(shù)Kappa診斷比值比F1Matthew相關(guān)系數(shù)(MCC)

      F1有點類似AUPRC,且存在一些共同的問題:(1) F1忽略了真陰性的問題;(2) F1沒有直觀的解釋;(3) 僅通過交換結(jié)果標簽(將1變?yōu)?,0變?yōu)?),F(xiàn)1的絕對值就會發(fā)生變化。MCC同樣也沒有直觀的解釋。

      在給定的決策閾值t下,所有的分類指標都屬于不恰當(improper)的指標。某些分類指標(如平衡準確率、約登指數(shù)和F1)在t=0.5(分類準確率)或t等于真實患病率時是半恰當(semi-proper)的指標,但這些閾值t很少是最具臨床相關(guān)性的閾值。F1是唯一一個沒有明確關(guān)注統(tǒng)計性能的匯總指標,因為它混合了分類效能與臨床效用。

      與分類性能相關(guān)的圖表包括ROC曲線和PR曲線,這些圖展示了在所有可能的決策閾值下的部分分類指標。這些圖的局限性在于并不容易直接觀察到閾值(見圖1)。另一種圖是分類圖(classification plot)(圖4),在x軸上展示決策閾值,在y軸上展示一個或多個分類指標。


      圖4. ADNEX模型的分類圖

      ADNEX模型在10%的閾值下,顯示出分類準確率為0.79(95% CI 0.77–0.82),F(xiàn)1為0.82(0.79–0.84),MCC為0.63(0.58–0.67)。

      臨床效用(Clinical utility)

      根據(jù)經(jīng)典的決策分析理論,臨床效用關(guān)注的是基于模型分類所做出的決策質(zhì)量,這些分類需要對應(yīng)于臨床相關(guān)的閾值。為了評估效用,要明確考慮誤分類成本。在醫(yī)療領(lǐng)域的預(yù)測研究中,用于評估臨床效用最常用的指標是凈效益(net benefit)。標準化凈效益等于凈效益除以患病率,最大值為1。

      凈效益根據(jù)誤分類成本設(shè)定決策閾值。設(shè)定誤分類成本并不容易,關(guān)于成本應(yīng)該是什么,還存在爭議。因此,凈效益或標準化凈效益會在一系列合理的決策閾值范圍內(nèi)繪制決策曲線。凈效益和標準化凈效益屬于半恰當指標。

      還有一個指標是預(yù)期成本(expected cost)。與凈效益不同,預(yù)期成本關(guān)注的是,給定誤分類成本時讓總成本最小化的決策閾值,預(yù)期成本也是半恰當指標。如果把成本標準化為總和為1,可以繪制出一系列標準化的假陽性和假陰性成本的預(yù)期成本圖。

      根據(jù)決策理論,關(guān)鍵是要檢查模型是否比參考策略(即治療所有的人或任何人都不治療)具有更好的效用,如果更好的話,還要和其他競爭模型比較。在所有合理的決策閾值范圍內(nèi),ADNEX的(標準化)凈效益均優(yōu)于參考策略(圖5A-B)。預(yù)期成本曲線也給出了相同的結(jié)果(圖5C)。當t=0.1時,模型的凈效益為0.44。假陰性的標準化成本為0.9,預(yù)期成本在t=0.06時最小化至0.35。




      圖5. ADNEX模型的決策曲線:凈效益、標準化凈效益和預(yù)期成本

      總結(jié)

      本文評估了用于醫(yī)療實踐的預(yù)測性AI模型在五個性能維度(區(qū)分度、校準度、整體性能、分類性能和臨床效用)的32項指標。在驗證預(yù)測模型性能時,要避免使用那些不恰當(improper)的指標(共13項),或那些未能明確聚焦于統(tǒng)計性能或決策分析性能的指標(3項;見表1)。其中,F1是唯一同時違反上述兩項特征的指標

      不恰當指標可能誤導(dǎo)研究者,而那些在未妥善考慮誤分類成本的情況下,將統(tǒng)計性能與決策分析性能混為一談的指標則具有模糊性,應(yīng)被專門用于評估臨床效用的指標所取代。

      表1. 在驗證用于臨床決策的預(yù)測模型時,常用的各類指標與圖表的建議

      指標

      建議

      區(qū)分度(Discrimination)

      AUROC

      該指標量化模型的區(qū)分度,是統(tǒng)計模型性能的關(guān)鍵組成部分。

      AUPRC和pAUROC

      不建議

      這些指標試圖超越單純的統(tǒng)計評估,但又不符合決策分析的基本原則。

      ROC曲線和PR曲線

      非必需,但也沒有不建議

      相較于AUROC,這些曲線提供的額外信息有限。

      校準度(Calibration)

      O/E比(觀察值/期望值比)

      非必需,但也沒有不建議

      該指標易于解釋,但僅能部分反映校準情況;在內(nèi)部驗證中,O/E比常為1或接近1。

      校準截距與校準斜率

      非必需,但也沒有不建議

      這些指標難以直觀解釋,且僅提供部分校準信息;內(nèi)部驗證時,校準斜率可用于評估過擬合風(fēng)險。

      ECI、ICI和ECE

      非必需

      這些指標是對校準圖的匯總性指標,會掩蓋校準偏差的性質(zhì)和方向,且存在統(tǒng)計一致性問題。

      校準圖或可靠性圖

      這是評估校準度最富洞察的方法,推薦使用平滑法而非分組法;內(nèi)部驗證時可優(yōu)先使用校準圖,若僅報告校準斜率也是可接受的;外部驗證時強烈推薦使用校準圖,并應(yīng)標明不確定性(例如95%CI)。

      整體性能(Overall performance)

      對數(shù)似然、Brier 評分、R2 類指標

      非必需,但也沒有不建議

      建議將區(qū)分度與校準度分開評估。這些指標在模型選擇中高度相關(guān),但本文未涵蓋該內(nèi)容。

      區(qū)分度斜率與平均絕對預(yù)測誤差(MAPE)

      不建議

      這些指標屬于“不恰當”指標,即錯誤模型的得分可能優(yōu)于正確模型。

      風(fēng)險分布圖

      展示不同結(jié)局類別下風(fēng)險預(yù)測值的分布,有助于深入理解模型。

      分類性能(Classification)

      分類準確率、平衡準確率、約登指數(shù)、診斷比值比、Kappa、F1、MCC

      不建議

      在臨床相關(guān)決策閾值下,這些指標均“不恰當”;此外,部分指標難以解釋。

      靈敏度與特異度

      非必需;若一起報告可作為描述性指標

      分別單獨報告是不合適的,但若兩者同時報告,可作為描述性指標。然而,因其依賴實際結(jié)局,在預(yù)測時不具備直接實用性。

      陽性預(yù)測值(PPV)與陰性預(yù)測值(NPV)

      非必需;若一起報告可作為描述性指標

      分別單獨報告是不合適的,但同時報告具有高度臨床實用性。

      分類圖

      非必需,但也沒有不建議

      可作為描述性圖表呈現(xiàn),按閾值展示靈敏度與特異度,或PPV與NPV。

      臨床效用(Clinical utility)

      凈效益或標準化凈效益(帶決策曲線),預(yù)期成本(帶成本曲線)

      這些是量化模型能否促成更優(yōu)臨床決策的重要指標。凈效益的決策曲線可展示在不同臨床相關(guān)閾值下,相對于參考策略(及其他競爭模型)的潛在臨床價值。

      本文認為,面向醫(yī)療實踐的預(yù)測性AI模型的性能評估應(yīng)聚焦于區(qū)分度、校準度和臨床效用。區(qū)分度和校準度有助于建模者和臨床醫(yī)生理解如何改進模型,臨床效用則從決策者和患者的角度出發(fā),評估模型是否能促成更優(yōu)的臨床決策。

      本文推薦采用以下核心指標與圖表組合在研究報告中呈現(xiàn):

      • AUROC(用于評估區(qū)分度);

      • 平滑校準圖(用于評估校準度);

      • 臨床效用指標(如帶決策曲線的凈效益);

      • 按結(jié)局類別展示預(yù)測概率分布的圖形

      在內(nèi)部驗證AI模型時,校準度的重要性可能相對較低,因為模型開發(fā)與內(nèi)部驗證基于相同的人群。但在外部驗證中(即在不同人群或臨床環(huán)境中評估模型時),校準度就尤為關(guān)鍵。盡管內(nèi)部驗證時使用校準圖也有價值,但僅報告校準斜率,輔以O(shè)/E比通常已足夠,對于構(gòu)建良好的模型,預(yù)期其O/E比應(yīng)接近1。

      除上述核心指標外,PPV聯(lián)合NPV,或靈敏度聯(lián)合特異度,也可作為描述性指標予以報告。但需注意,這些指標若單獨報告則屬于“不恰當”指標。

      所有報告的指標和圖表,在可能的情況下都應(yīng)附帶置信區(qū)間,臨床效用指標除外,針對其不確定性的量化仍是近期學(xué)術(shù)爭論與研究的焦點。

      本文建議不要使用 F1、AUPRC 或 pAUROC,而應(yīng)采用專門的臨床效用指標來評估模型性能。需要指出的是,本文的觀點不適用于某些真陰性難以明確定義的醫(yī)療場景,例如病灶檢測。

      有三個與性能評估相關(guān)的重要問題值得強調(diào):樣本量(sample size)、性能異質(zhì)性(performance heterogeneity)、報告透明度(reporting transparency)。

      充足的樣本量對于精確評估模型性能至關(guān)重要。以往建議最小的結(jié)局類別中至少包含100至200名個體。目前已有更具體的樣本量計算方法用于基于回歸的預(yù)測模型。在比較不同模型的校準性能時,通常需要更大的樣本量。

      由于不同地區(qū)、環(huán)境或時間段的人群特征和測量流程存在差異,模型性能的異質(zhì)性是預(yù)料中的。可通過Meta分析和Meta回歸對多個外部驗證研究的性能異質(zhì)性進行量化和解釋。若簡單地將基于不同外部數(shù)據(jù)集驗證的模型進行直接比較,可能得出錯誤結(jié)論。

      全面透明地報告預(yù)測性AI模型研究至關(guān)重要,可遵循TRIPOD+AI及相關(guān)報告規(guī)范。為避免“性能操縱”(performance hacking),應(yīng)重視預(yù)先發(fā)表研究方案,并在合理可行的情況下共享代碼和數(shù)據(jù)

      本文整理自:Lancet Digit Health. 2025 Dec 13:100916.


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      李亞鵬復(fù)婚登上熱搜,前妻海哈金喜回應(yīng):我們都是夏夏的父母,不會不聯(lián)系和尷尬,我們都很好,謝謝大家關(guān)心

      李亞鵬復(fù)婚登上熱搜,前妻海哈金喜回應(yīng):我們都是夏夏的父母,不會不聯(lián)系和尷尬,我們都很好,謝謝大家關(guān)心

      臺州交通廣播
      2026-04-24 19:02:38
      打起來了,以色列本土被炸,內(nèi)塔尼亞胡或被逮捕?特朗普態(tài)度轉(zhuǎn)變

      打起來了,以色列本土被炸,內(nèi)塔尼亞胡或被逮捕?特朗普態(tài)度轉(zhuǎn)變

      志宏教授
      2026-04-26 00:52:22
      CBA常規(guī)賽全部結(jié)束,賀西寧一共拿了824分,那么胡明軒和張寧呢

      CBA常規(guī)賽全部結(jié)束,賀西寧一共拿了824分,那么胡明軒和張寧呢

      羅納爾說個球
      2026-04-25 19:10:27
      A股:散戶做好下車準備,主力意圖已經(jīng)很明確,下周,要變天了?

      A股:散戶做好下車準備,主力意圖已經(jīng)很明確,下周,要變天了?

      云鵬敘事
      2026-04-26 00:00:07
      雨雨雨!暴跌10℃!江蘇最新天氣預(yù)測!

      雨雨雨!暴跌10℃!江蘇最新天氣預(yù)測!

      江南晚報
      2026-04-26 03:00:28
      遼寧艦,山東艦,四川艦齊聚南海,德專家:殲35殲15與攻擊21協(xié)同

      遼寧艦,山東艦,四川艦齊聚南海,德專家:殲35殲15與攻擊21協(xié)同

      混沌錄
      2026-04-23 16:50:23
      五一前后屬兔人躲不過的劫,究竟是啥?

      五一前后屬兔人躲不過的劫,究竟是啥?

      愛下廚的阿釃
      2026-04-25 04:09:42
      哈弗茨和埃澤先后因傷離場,阿森納一戰(zhàn)折損兩員大將

      哈弗茨和埃澤先后因傷離場,阿森納一戰(zhàn)折損兩員大將

      懂球帝
      2026-04-26 03:32:06
      圣馬克西曼:對手已無欲無求卻比我們更有斗志,這不正常

      圣馬克西曼:對手已無欲無求卻比我們更有斗志,這不正常

      懂球帝
      2026-04-25 07:10:48
      7年敗光80億!華誼兄弟申請破產(chǎn),56歲王中磊落魄,兒子在美瀟灑

      7年敗光80億!華誼兄弟申請破產(chǎn),56歲王中磊落魄,兒子在美瀟灑

      阿庫財經(jīng)
      2026-04-25 12:50:08
      男乒在倫敦團體世乒賽上被淪落為最弱團隊,這個賬該算在誰頭上?

      男乒在倫敦團體世乒賽上被淪落為最弱團隊,這個賬該算在誰頭上?

      鴻印百合
      2026-04-24 21:24:43
      教育異化:是培育未來還是摧毀希望?

      教育異化:是培育未來還是摧毀希望?

      烽火瞭望者
      2026-04-25 13:38:25
      女人能活多久,看乳房就知?乳房有這3個異常,長壽無望?

      女人能活多久,看乳房就知?乳房有這3個異常,長壽無望?

      醫(yī)學(xué)科普匯
      2026-04-07 19:55:08
      周美青身邊人爆猛料!蕭旭岑沉冤得雪,邱毅一語戳破藍營內(nèi)斗真相

      周美青身邊人爆猛料!蕭旭岑沉冤得雪,邱毅一語戳破藍營內(nèi)斗真相

      老鵜愛說事
      2026-04-25 01:15:19
      賀州滅門案:妹妹為錢殺害姐姐一家四口,落網(wǎng)后提出一個無恥請求

      賀州滅門案:妹妹為錢殺害姐姐一家四口,落網(wǎng)后提出一個無恥請求

      南書房
      2026-04-24 21:25:03
      廣州番禺一小區(qū)車庫流浪貓被軋死 街道辦回應(yīng):將建長效機制

      廣州番禺一小區(qū)車庫流浪貓被軋死 街道辦回應(yīng):將建長效機制

      新快報新聞
      2026-04-25 20:04:15
      娛樂圈“模范夫妻”人設(shè)崩塌,家暴、蕩婦羞辱、孕期聊騷,占全了

      娛樂圈“模范夫妻”人設(shè)崩塌,家暴、蕩婦羞辱、孕期聊騷,占全了

      庭小娛
      2026-04-25 19:15:03
      黑尾醬,徹底消失了?

      黑尾醬,徹底消失了?

      生如稗草
      2026-03-15 08:48:11
      鏈家悄悄上線新功能,買房賣房都坐不住了

      鏈家悄悄上線新功能,買房賣房都坐不住了

      大川東山再起
      2026-04-25 23:06:28
      盧旺達:從軍事到經(jīng)濟,全盤抄中國作業(yè),經(jīng)濟起飛,暴打鄰國

      盧旺達:從軍事到經(jīng)濟,全盤抄中國作業(yè),經(jīng)濟起飛,暴打鄰國

      牛牛叨史
      2025-07-03 01:14:51
      2026-04-26 05:07:00
      醫(yī)咖會
      醫(yī)咖會
      生動有趣的形式傳遞醫(yī)學(xué)新進展
      2816文章數(shù) 11002關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

      頭條要聞

      媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

      頭條要聞

      媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《我們的爸爸2》第一季完美爸爸翻車了

      財經(jīng)要聞

      90%訂單消失,中東旺季沒了

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態(tài)度原創(chuàng)

      手機
      家居
      健康
      藝術(shù)
      軍事航空

      手機要聞

      iPhone Ultra機模上手:11mm厚、無長焦,蘋果第一折就這?

      家居要聞

      自然肌理 溫潤美學(xué)

      干細胞如何讓燒燙傷皮膚"再生"?

      藝術(shù)要聞

      最適合作為抖音總部的大樓,它在福建莆田!

      軍事要聞

      美防長:戰(zhàn)事不會“沒完沒了”

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 18pao成人国产永久视频| 日本色导航| 久99国产精品人妻aⅴ| 亚洲精品久久久无码一区二区| 亚洲精品乱码久久久久久按摩高清 | 国产一区二区三区在线影院| 久久这里都是精品一区| 丰满人妻在线一区二区三区视频53| 久久精品亚洲精品国产色婷| 大黑人交xxxx18视频| 亚洲国产一区二区三区久| 国产精品疯狂输出jk草莓视频| 欧美丰满大乳高跟鞋| 伊人色影院| 欧美性受xxxx黑人xyx性爽| 狠狠婷婷综合久久久久久| 亚洲午夜成人片| 自拍偷自拍亚洲精品偷一| 日韩无码2020| 亚洲综合A| 中文字幕在线影视| 真实国产乱子伦精品一区二区三区| 国产精品污www在线观看| 蜜桃秘?av一区二区三区安全| 国产中文字幕一区二区| 日本另类αv欧美另类aⅴ| av不卡在线永久免费观看| 婷婷五月综合色视频| 清纯校花的被脔日常h动漫| 久热re这里精品视频在线6 | 亚洲AV无码电影在线播放| 国产精品av在线一区二区三区| 日日躁狠狠躁狠狠爱| 亚洲人成网站在线播放942| 无码精品国产va在线观看dvd| 亚洲精品一区二区三区在线观看| 国产麻豆精品久久一二三| 亚洲天堂高清| 欧美老熟妇乱子伦牲交视频| 狠狠干影院| 亚洲AV无码一区东京热久久|