![]()
圖源:Pixabay
編者按
- 抑郁癥正在向低齡化蔓延,這已是全球共識。但在中國,當我們試圖看清這一現象時,卻常常陷入迷霧:中國孩子的抑郁檢出率,數據為何總是“打架”?
- 《知識分子》曾在過往的報道中指出一個令人困惑的現象:不同研究中,中國兒童青少年的抑郁患病率竟從 4% 跨越到了 41%。(見《知識分子》往期推送:在精神科門診里,孩子們的年紀越來越小)這種巨大的數據鴻溝,連在中國研究自殺問題38年的精神科專家費立鵬都曾直言:“數據的可靠性沒那么高。”
- 問題究竟出在哪里?
- 這一次,來自南京師范大學與某三甲醫院心理門診的研究團隊揭開了一個被忽視的真相:我們可能正在用“錯誤的尺子”衡量中國的孩子。
- 研究發現,現有的測量量表宛如“盲人摸象”——沒有一個癥狀出現在所有量表中;也沒有任何一個量表測量到了所有的癥狀。甚至,即便同一個孩子,在這張問卷上被判定為抑郁,換一張問卷可能就是“正常”。我們長期依賴成人的標準、西方的量表,卻唯獨缺少一把專屬于中國青少年的精準“尺子”。
- 如果連刻度都是模糊的,我們該如何守護下一代的心理健康?這并非杞人憂天,而是基于嚴謹數據的追問。以下是幾位學者的研究發現:
撰文|胡傳鵬、汪浩遠
責編 | 李珊珊
抑郁已成為困擾兒童與青少年的主要心理健康問題。全球約90%的青少年生活在發展中國家,而他們的抑郁檢出率正在快速上升。最近一次系統回顧和薈萃分析也顯示大約五分之一的兒童青少年目前經歷抑郁或報告抑郁癥狀(Lu et al., 2024)。這些數據,以及其他的心理健康問題的數據一起,使得青少年心理健康,尤其是抑郁問題成為全社會關注的問題。
解決問題的第一步是科學地評估,也就是:以什么標準判斷一個人是否抑郁?這個非常重要的問題,卻往往經常被忽視,尤其是在青少年抑郁的語境中。許多大規模調查的結果在朋友圈廣泛傳播時,卻很難找到這些調查中用來判斷抑郁的標準是什么。
為了了解這個問題,我們對最近一些大規模調查中使用的抑郁篩查工作進行了探索。我們發現,臨床篩查和大型流行病學調查均依賴由被調查者報告的抑郁量表,且不同的調查中使用的問卷可能不盡相同。例如總樣本高達19萬多的《中國國民心理健康發展報告》藍皮書采用的方式是《簡版流調中心抑郁量表(CESD-9)》(傅小蘭, 張侃, 2023);共抽取 23個省、5個自治區、4個直轄市包含了共4萬多樣本的中國居民心理與行為調查研究采用的方式是《患者健康問卷(PHQ-9)》(榮麗敏 等, 2023)。一個問題浮現了:這些用來測量抑郁的不同“尺子”,它們測量的是同一個東西嗎?
為了回答這個問題,我們團隊進行了一項系統性的研究,首次在中國文化背景下,全面審視了用于兒童青少年的抑郁量表(見文末的預印本)。結果發現,這些“尺子”之間的差異之大,遠超我們最初的預期,不同的抑郁問卷測量的可能不是同一個東西。
01 沒有一個癥狀出現在所有兒童抑郁量表中,也沒有任何一個量表測量到了所有的癥狀
為了搞清楚當前至少有多少個抑郁量表用于測量兒童青少年的抑郁,我們進行了一次大規模的“學術摸底”工作。
第一步:海選。我們在四項覆蓋小學生至大學生心理健康檢出率的薈萃分析研究中,提取了441篇涉及到抑郁檢出率的學術論文(陳雨濛 等, 2022; 黃瀟瀟 等, 2022; 于曉琪 等, 2022; 張亞利 等, 2022, 非常感謝作者們分享了他們的薈萃分析數據!), 從這些論文中找出其用于評估抑郁的工具。在這一步中,我們共找到了33個獨特的量表。第二步:篩選。我們篩選每個量表中最權威的版本。例如,當一個量表有多個中文翻譯時,優先選用更新的、更準確的、以及信息更完整的中文版本。
最終,我們能夠找到27個量表的完整題目,它們是本次研究的對象。這其中不乏一些公眾熟知或官方推薦的量表,例如:被最新版《中國抑郁障礙防治指南》推薦使用的《患者健康問卷(PHQ-9)》,這里也包括一些中國學者自主開發的量表。
我們對這27個量表的385個條目進行了精細的“編碼”工作,試圖找出它們用于評估抑郁的細分標準。如果兩個題目測量的是同一個抑郁的癥狀,則我們將它合并。經過幾輪編碼與討論,我們發現這27個量表的385個條目共測量了 84個 彼此不同的癥狀(見圖1)。
值得的注意的是:沒有一個癥狀出現在所有量表中;也沒有任何一個量表測量到了所有的癥狀。這意味著,每份量表都像在描繪抑郁的不同方面,沒有任何一份能囊括全貌, 這些量表放在一起,呈現出了一種盲人摸象的即視感。
![]()
圖1. 二十七個量表的內容重疊
每行是一個癥狀,每列是一份量表。一條橫線上有多個點,這意味著這個癥狀出現在多個量表中。紅色為年齡特異項,藍色為文化特異項。可以看到大量“只出現一次”的獨特癥狀。
然而,比“有什么”更觸目驚心的是“沒什么”——這些量表之間嚴重缺乏一致性。 為了定量比較這些量表的重合度,我們計算了它們的重合度指數(Jaccard系數)。結果如圖2所示。所有量表之間的平均重合度低至0.19,中位數僅為0.17,且四分位距(IQR)為0.11至0.25(見圖3)。這意味著,大部分量表之間的共同之處少得可憐,不同的量表雖然都聲稱自己測量的是抑郁,但是很有可能一個學生在量表 A 上被評為“抑郁”,在量表 B 上卻完全被評為“正常”。從研究角度看,不同抑郁量表并不能互換使用,對抑郁研究的可復制性和普遍性造成了威脅。
![]()
圖2. 二十七個抑郁量表條目之間的重合度指數
![]()
圖3.展示了所有抑郁量表之間重合度(Jaccard指數)的分布。分布呈右偏(眾數 = 0.13,中位數 = 0.17,IQR = 0.11–0.25),表明大多數量表之間僅存在較小比例的癥狀重疊,僅有少量量表組合表現出中度或較高重疊。
02 被忽略的“角落”:文化與年齡的特異性癥狀
已經有不少研究表明,抑郁等心理健康問題,其癥狀可能會受到文化的影響,例如:擔憂(worry)在南亞和東南亞中更常見,而想的太多(thinking too much)在東南亞和撒哈拉以南非洲人口中更為常見(Haroz et al., 2017)。同時,抑郁在不同年齡階段也可能有巨大的差異。例如,植物性癥狀(Vegetative symptoms)、食欲變化(appetite change)和體重變化(weight change)、能量喪失(loss of energy)和失眠(insomnia)在青少年重度抑郁癥患者中比成人更常見。快感缺乏(Anhedonia)/興趣喪失(loss of interest)和注意力集中問題(concentration problems)在成年重度抑郁癥患者中更為常見(Rice et al., 2019)。
那么對于中國兒童青少年的抑郁測量中,有多少癥狀考慮到了文化與年齡段的特殊性呢?這個結果并不樂觀:只有少量中國學者自主研發的量表有少量的文化特異性的癥狀。同樣,只有少量專門為兒童青少年設計的量表才包含 “年齡特異性癥狀”。在全部27個量表中,僅有8個量表關注了年齡的特點特性,更是只有4個量表,關注到了文化的特性。
換句話說,我們可能是在“用西方成人尺子量中國孩子”。回到最初那四百多篇關于抑郁檢出率的文章,他們明確聚焦于從小學到大學的中國學生群體,但使用頻率高的量表卻是為成人設計的工具。其中使用最廣的(在441項研究中出現了129次),是由美國杜克大學教授William W.K. Zung在1965年開發的《宗氏抑郁自評量表(SDS)》(Zung, 1965),其適用于具有抑郁癥狀的成年人。排名其次的是由Leonard R. Derogatis于1973年編制的《癥狀自評量表(SCL-90)》(Derogatis et al., 1973),這一量表適用于精神科或非精神科的成年門診病人,出現了113次 。
03 假如我們用四個抑郁問卷測量同一批人,會出現什么結果?
為了檢驗問卷內容上的差異是否會導致它們在篩檢時出現不同的結果,我們進一步分析來自北京某醫院近1.25萬名7-18歲青少年的數據,這些孩子均完成了四個常用量表:《兒童抑郁障礙自評量表(DSRSC)》;《患者健康問卷(PHQ-9)》; 《抑郁-焦慮-壓力自評量表(DASS-21)》;《兒童抑郁量表(CDI)》。
結果發現檢出率之間的差異確實存在:對于同一批孩子,四個量表的抑郁檢出率從49.25%到62.43%不等(見圖4A)。雖然四個量表均會將一批人識別為抑郁,但同樣值得注意的是:每個量表都找到了一批“獨特”的抑郁者,例如:有833個孩子僅被DASS-21量表判定為抑郁,而其他量表則認為他們“正常”(見圖4B)。這印證了我們擔心的問題:同一個人在不同問卷上可能從“抑郁”變成“不抑郁”。
![]()
圖4. 四個自評量表對同一人群的抑郁檢出率。不同顏色的柱子清晰顯示,DASS-21的檢出率最高,而CDI的檢出率最低。3B展示了被不同量表組合識別出的患者分布。最淺色的區域代表僅被一個量表識別出的“獨特”患者,面積巨大,尤其是僅被DASS-21識別的人群(833人),說明不同量表捕捉的是不盡相同的群體。
在追溯這些量表的過程中,我們還遇到了一些令人啼笑皆非的“尷尬”瞬間,比如:令人無奈的翻譯錯誤。
在追溯國際常用的《流調中心抑郁量表(CES-D)》時,我們發現,其中描述精神層面的“打不起精神”(I could not get “going”),在某個早期廣泛流傳的中文版本里,竟被直接翻譯成了 “我走路很慢” 。這個錯誤直到十年后才在新譯本中被糾正。讓人擔憂的是,含有錯誤翻譯的老版本在正確的新版本出現后仍然繼續被引用(14次),其次數甚至超過了新版本的引用數,后者只有5次。
04 下一步該做什么?
作為研究者,這項工作的結果讓我們不安。這些不一致的抑郁問卷在提醒我們所有人。對家長和臨床工作者而言:請意識到,特定的抑郁問卷可能僅反映了抑郁的一部分內容,不能過度依賴其結論。對于嚴肅的抑郁診斷,請務必尋求更全面的臨床評估。
對研究者和政策制定者而言:當解讀基于不同量表得出的大規模數據時,需要意識到其背后可能存在的“測量誤差”。對于研究者而言,如何建立一套具備科學性、文化與年齡適應性的評估問卷或者問卷系統,可能是亟待推進的工作(Fried et al., 2022)。
準確地測量是有效干預的前提;如何測量抑郁本身也反映了我們對該問題認識的深度。心理健康問題作為一個復雜的問題,目前仍然有太多的未知之處,需要研究者的合作與不斷努力。深入理解中國兒童青少年的抑郁問題,并為中國兒童青少年找到一把更精準、更合適的“尺子”,不僅是科學進步的要求,更關乎下一代健康成長的責任。
更多研究細節,見: Wang, Hu, Tian, Liu, An, Li, & Hu. The Heterogeneity of Youth Depression Scales. Chinaxiv. DOI:10.12074/202510.00115
參考文獻:
- [1] 陳雨濛, 張亞利, 俞國良. (2022). 2010~2020 中國內地大學生心理健康問題檢出率的元分析. 心理科學進展, 30(5), 991–1004.
- [2] 傅小蘭, 張侃. (2023). 中國國民心理健康發展報告(2021~2022). 北京: 社會科學文獻出版社.
- [3] 黃瀟瀟, 張亞利, 俞國良. (2022). 2010~2020 中國內地小學生心理健康問題檢出率的元分析. 心理科學進展, 30(5), 953–964.
- [4] 榮麗敏, 鄭藝, 段熙明, 劉彥志, 張曉燕, 胡瑞宇, … 劉燕. (2023). 2021和2022年中國居民抑郁和焦慮癥狀及其共患的相關因素. 中國心理衛生雜志, 37(12), 1023–1030.
- [5] 于曉琪, 張亞利, 俞國良. (2022). 2010~2020 中國內地高中生心理健康問題檢出率的元分析. 心理科學進展, 30(5), 978–990.
- [6] 張亞利, 靳娟娟, 俞國良. (2022). 2010~2020 中國內地初中生心理健康問題檢出率的元分析. 心理科學進展, 30(5), 965–977.
- [7] Derogatis, L. R., Lipman, R. S., & Covi, L. (1973). SCL-90: An outpatient psychiatric rating scale—preliminary report. Psychopharmacology Bulletin, 9(1), 13–28.
- [8] Fried, E. I., Flake, J. K., & Robinaugh, D. J. (2022). Revisiting the theoretical and methodological foundations of depression measurement. Nature Reviews Psychology, 1–11. https://doi.org/10.1038/s44159-022-00050-2
- [9] Haroz, E. E., Ritchey, M., Bass, J. K., Kohrt, B. A., Augustinavicius, J., Michalopoulos, L., … Bolton, P. (2017). How is depression experienced around the world? A systematic review of qualitative literature. Social Science & Medicine, 183, 151–162.
- [10] Lu, B., Lin, L., & Su, X. (2024). Global burden of depression or depressive symptoms in children and adolescents: A systematic review and meta-analysis. Journal of Affective Disorders, 354, 553–562.
- [11] Rice, F., Riglin, L., Lomax, T., Souter, E., Potter, R., Smith, D. J., … Thapar, A. (2019). Adolescent and adult differences in major depression symptom profiles. Journal of Affective Disorders, 243, 175–181.
- [12] Zung, W. W. K. (1965). A Self-Rating Depression Scale. Archives of General Psychiatry, 12(1), 63.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.