寒假提升計劃
看了這么多頂刊文獻,想要進行數據分析的心是不是蠢蠢欲動了?寒假期間 PsyBrain 腦心前沿團隊會帶來一些數據分析流程的講解,配合示例數據和代碼,帶你跑通復雜的頂刊分析流程,歡迎大家關注~
如果你有感興趣的、想學習的分析方法,歡迎給我們留言~
基本信息
Title:Machine learning enables efficient neurocognitive profiling in patients with schizophrenia
發表時間:2026.1.7
Journal:Nat. Mental Health
影響因子:8.7
獲取原文:
- 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
- 點擊頁面底部“”即可跳轉論文原網頁
![]()
研究動機與背景
精神分裂癥(SCZ)是一種以認知障礙為核心特征的致殘性精神疾病,這種障礙不僅出現在病程早期,且能有效預測患者的功能預后,但目前的臨床評估嚴重依賴冗長且耗時的測試電池,導致其在現實醫療場景中難以部署 。雖然神經認知領域能客觀反映底層的神經生物學過程,但多日的測試負擔限制了生物標志物的大規模應用,因此迫切需要開發更短、更高效且具有同等診斷價值的評估工具 。作者試圖利用機器學習技術,從海量的神經認知數據中提取最關鍵的特征子集,以實現精神分裂癥的精準且高效的臨床剖析 。
實驗設計與方法邏輯
研究者尋求確定是否可以通過神經認知域的一個子集來有效區分精神分裂癥患者與健康對照者 。他們假設,在保持分類準確性的前提下,可以大幅降低模型的復雜度 。
為了實現這個目標,本研究基于 COGS-2 研究中 559 名患者和 745 名健康對照者的 15 項神經認知評估數據,首先采用 UMAP 降維技術進行高維數據的可視化展示,以觀察兩組間的整體認知差異 。隨后,研究者訓練了八種不同的機器學習算法(包括線性、非線性及神經網絡模型),并通過重復五折交叉驗證優化參數,以評估這些模型在區分 SCZ 和 HCS 方面的性能 。為了進一步簡化模型,作者計算了特征重要性方差(FIV),并利用遞歸特征消除(RFE)算法迭代移除冗余特征,最終確立了一個僅包含核心特征的“精簡模型” 。最后,該模型在完全獨立的 COGS-1 隊列中進行了外部驗證,以確保其科學發現的可靠性與一般性 。
核心發現
神經認知圖譜的顯著分離
UMAP 分析顯示,僅基于 15 個認知內表型,患者組與對照組在二維空間中表現出明顯的群體分離。并且線性模型性能占優:在八種 ML 模型中,提升廣義線性模型(LM_BoostedGLM)表現最佳(ROC 0.899),顯著優于某些更復雜的樹狀模型
![]()
Fig. 1 | Neurocognitive profiles distinguish between SCZ and HCS. Fig1 證明精神分裂癥患者與健康人在全局認知維度上存在顯著群體分離 ,且多種機器學習模型均能以約 0.90 的高精度實現疾病分類
![]()
Table 3 展示了八種機器學習模型的對比結果
“以少勝多”的精簡模型
通過 RFE 篩選發現,僅保留“言語學習(CVLT_Total_Correct)”和“情緒識別(CNB_Emotion_Identification)”兩個認知域,即可實現 0.888 的 ROC 曲線下面積,與包含 15 個特征的完整模型相比無顯著差異。并且模型存在跨隊列的強穩健性,該精簡模型在獨立的驗證隊列(COGS-1)中依然保持了良好的分類能力(ROC 0.85),證明了其作為生物標志物的泛化潛力
![]()
Fig. 2 | Feature selection and performance of a sparse ML model. Fig2 展示了核心指標篩選與驗證,確立了言語學習與情緒識別是區分病患的核心認知指標 ,并證實該精簡模型在獨立外部隊列中依然具有強大的泛化能力與診斷價值
省流總結
針對精神分裂癥臨床認知評估耗時冗長的痛點,本研究利用大規模隊列數據和機器學習算法證明,僅通過測量“言語學習”和“情緒識別”兩個關鍵認知域,即可達到與全套復雜測試相當的診斷準確性 。這一發現不僅揭示了精神分裂癥最具代表性的病理認知特征,更為臨床醫生提供了一種可以在短時間內完成的、客觀的數字化診斷輔助工具,具有極高的現實應用價值 。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.