<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      重返描述:定量研究中的數(shù)據(jù)深描

      0
      分享至



      馬文

      南京大學(xué)

      新聞傳播學(xué)院

      助理研究員


      陳云松

      南京大學(xué)

      社會學(xué)院

      教授

      重返描述:定量研究中的數(shù)據(jù)深描

      來源 | 《社會學(xué)研究》2026年第2期

      作者 | 馬文、陳云松

      責(zé)任編輯 |趙夢瑤

      在定量研究中,描述因缺乏解釋能力被逐漸邊緣化,而數(shù)智技術(shù)的發(fā)展為其重返研究核心提供了新的可能。本文提出不同于回歸模型假設(shè)檢驗(yàn)的“數(shù)據(jù)深描”方法,旨在運(yùn)用多模態(tài)數(shù)據(jù)和算法技術(shù),對社會現(xiàn)象及過程的時(shí)空結(jié)構(gòu)和潛在關(guān)系進(jìn)行清晰呈現(xiàn)。數(shù)據(jù)深描通過可視化結(jié)構(gòu)展示、數(shù)智化指標(biāo)測量、局部描述關(guān)聯(lián)累積與算法模型因果預(yù)示,分別形成關(guān)于結(jié)構(gòu)感知的“景深”、概念指標(biāo)的“進(jìn)深”、關(guān)聯(lián)呈現(xiàn)的“層深”與潛在因果的“縱深”,從而為定量研究從描述性理解向解釋性理解的轉(zhuǎn)變搭建橋梁,也體現(xiàn)了構(gòu)建中國自主知識體系的方法自覺。

      一、引言

      在社會科學(xué)實(shí)證研究中,描述是一種不可或缺的研究方法。它主要通過展陳和敘述實(shí)證材料中的具象信息,形成對研究對象的全面深入認(rèn)知。描述所呈現(xiàn)的社會現(xiàn)象和過程,有助于我們理解世界的異質(zhì)特征與發(fā)展規(guī)律。根據(jù)社會科學(xué)的傳統(tǒng),定量描述被視為一種通過展示數(shù)據(jù)樣本分布來歸納結(jié)論的方法,區(qū)別于推論統(tǒng)計(jì)和因果分析等推理路徑。例如,《牛津社會學(xué)詞典》將定量描述中的描述性統(tǒng)計(jì)定義為“描述變量以及變量關(guān)系的強(qiáng)度和性質(zhì)”(Scott,2014:726),即旨在基于樣本分析,概括變量及其關(guān)系的特征。

      自定量研究方法興起以來,變量特征的描繪與變量關(guān)系的理解始終是社會科學(xué)研究的核心。在其發(fā)展早期,描述曾兼具變量特征刻畫與變量關(guān)系理解的雙重功能。隨著多元回歸模型和高級計(jì)量方法的發(fā)展與成熟,當(dāng)代定量研究主要致力于厘清變量間的“凈關(guān)聯(lián)”“凈效應(yīng)”,以及更嚴(yán)格的因果關(guān)系識別。由此,定量研究中的描述與解釋在功能和載體上日漸分化。描述一般只限于展示核心變量的關(guān)鍵統(tǒng)計(jì)量,成為變量關(guān)聯(lián)分析或因果推斷的前置步驟,其對于理論生成和假說檢驗(yàn)的學(xué)術(shù)價(jià)值在很大程度上被削弱。這種“因果識別為要,特征描述為輔”的研究模式,已成為近半個(gè)世紀(jì)以來定量研究的標(biāo)準(zhǔn)化流程。

      針對描述在當(dāng)代社會科學(xué)定量研究中的價(jià)值和定位,諸多學(xué)者進(jìn)行了持續(xù)反思。例如,戈德索普(John H. Goldthorpe)認(rèn)為,描述性統(tǒng)計(jì)方法對變量特征與結(jié)構(gòu)模式的揭示,仍是開展因果分析的前提(Goldthorpe,2001);拉圖爾(Bruno Latour)則強(qiáng)調(diào)社會科學(xué)的描述需借助類似自然科學(xué)的技術(shù)實(shí)踐來生成可見性(Latour,2005:136);薩維奇(Mike Savage)指出,對大規(guī)模數(shù)據(jù)進(jìn)行特征與相關(guān)關(guān)系描述,具有催生新發(fā)現(xiàn)的強(qiáng)大潛力(Savage,2024)。這些持有“描述轉(zhuǎn)向”立場的學(xué)者主張,研究者應(yīng)更重視統(tǒng)計(jì)特征值與可視化圖表,從而推動(dòng)研究從“什么正在發(fā)生”向“為什么會發(fā)生”深入。然而,現(xiàn)有討論仍多圍繞調(diào)查數(shù)據(jù)中的變量取值及其分布展開,此類描述在理解能力上仍被認(rèn)為不及因果推斷等解釋方法(Crompton,2008;Gane,2020)。

      定量描述在當(dāng)代社會科學(xué)中的定位局限,也與數(shù)據(jù)條件與分析方法密切相關(guān)。根據(jù)韋伯對社會學(xué)理解的類型劃分,定量研究中的因果分析方法屬于典型的“解釋性理解”,而描述方法則對應(yīng)“直接觀察性理解”(Weber,1978:8),即后人概括的“描述性理解”(Scott,2014:368-369)。在傳統(tǒng)的定量研究模式下,定量描述往往停留在對統(tǒng)計(jì)量的表層概括,難以觸及變量之間的結(jié)構(gòu)性關(guān)聯(lián)及其因果生成機(jī)制。隨著數(shù)智時(shí)代的到來,特別是機(jī)器學(xué)習(xí)、人工智能等計(jì)算技術(shù)的發(fā)展,研究者得以在多模態(tài)、大規(guī)模數(shù)據(jù)中系統(tǒng)呈現(xiàn)社會現(xiàn)象的時(shí)空結(jié)構(gòu),并識別具有穩(wěn)定性的潛在關(guān)系,使描述不再僅僅是經(jīng)驗(yàn)背景的鋪陳,而是為理解社會過程“如何發(fā)生”提供關(guān)鍵線索。因此,數(shù)智賦能有望突破當(dāng)代定量描述的瓶頸,推動(dòng)描述方法重返定量研究的核心,并重塑其在知識生產(chǎn)體系中的地位。所謂“重返”,既意味著讓韋伯所界定的描述性理解重返定量研究的核心,也旨在探索描述對解釋性理解的貢獻(xiàn),從而再現(xiàn)其在定量社會學(xué)發(fā)展早期的活力。

      本文將這類方法稱為“數(shù)據(jù)深描”(deep description)。數(shù)據(jù)深描通過四種描述進(jìn)路深化描述性理解,并為通向解釋性理解搭建方法橋梁——借助可視化描述增強(qiáng)結(jié)構(gòu)感知的“景深”,通過數(shù)智方法拓展概念指標(biāo)的“進(jìn)深”,依托局部描述累積發(fā)現(xiàn)總體穩(wěn)定關(guān)系的“層深”,運(yùn)用算法模型預(yù)示潛在因果線索的“縱深”。在構(gòu)建中國社會學(xué)自主知識體系的過程中,該方法能夠很好地與中華文明五千多年的深厚文脈相結(jié)合,與中國式現(xiàn)代化的宏偉進(jìn)程相融匯,與中國超大規(guī)模社會中數(shù)智賦能的治理優(yōu)勢相貫通,從而最大限度地發(fā)揮描述在知識創(chuàng)新、理論創(chuàng)新和方法創(chuàng)新方面的潛力,充分體現(xiàn)構(gòu)建中國哲學(xué)社會科學(xué)自主知識體系的方法自覺(陳云松,2025)。

      二、描述的學(xué)脈

      在社會學(xué)的發(fā)展歷程中,描述方法尤其是定量描述方法,經(jīng)歷了從繁榮到式微的變化。盡管學(xué)界始終存在重新界定描述方法功能的呼聲,但受限于數(shù)據(jù)形態(tài)與分析手段,將描述重新帶回定量研究核心位置的愿景始終未能實(shí)現(xiàn)。下文將對這一進(jìn)程進(jìn)行簡要的回顧。

      (一)描述的早期應(yīng)用

      在社會科學(xué)發(fā)展的早期階段,研究者通常綜合運(yùn)用觀察、訪談、統(tǒng)計(jì)等多種方法,對社會現(xiàn)象進(jìn)行細(xì)致刻畫與理論提煉。尤其在19世紀(jì)下半葉,隨著眾多社會科學(xué)領(lǐng)域逐步建立為獨(dú)立學(xué)科,描述方法不僅作為實(shí)證研究的基礎(chǔ)工具,更成為社會科學(xué)理論體系的重要支撐。早期的描述研究多圍繞具體社會情境展開,通過對個(gè)案的深入剖析與經(jīng)驗(yàn)數(shù)據(jù)的整合歸納,推動(dòng)社會科學(xué)從哲學(xué)思辨轉(zhuǎn)向經(jīng)驗(yàn)分析。在此期間,描述方法大致可分為兩類:一是側(cè)重經(jīng)驗(yàn)意義挖掘的定性方法,如人類學(xué)中的民族志,以及其他關(guān)注事件和行動(dòng)的圖文呈現(xiàn);二是側(cè)重于變量關(guān)系呈現(xiàn)的定量描述。在經(jīng)典社會科學(xué)著作中,這兩類方法互為補(bǔ)充,共同塑造了社會科學(xué)理論知識的早期形態(tài)。

      對于韋伯而言,“描述性理解”著眼于社會行為本身所呈現(xiàn)的直接意涵,而“解釋性理解”則通過將該行為置于更完整的意義與動(dòng)機(jī)脈絡(luò)中,使其在具體情境中獲得可理解性(Weber,1978:8)。質(zhì)性研究者始終高度重視理解社會行為背后的意義結(jié)構(gòu),甚至提出了“厚描”(thick description,又譯“濃描”)等概念(Geertz,1973),以突顯差異性和地方性在通過描述進(jìn)行知識生產(chǎn)中的意義。雖然厚描仍屬于韋伯所說的直觀觀察或描述性理解,但它為從簡單描述走向解釋性理解建立了重要的中介路徑。

      與定性描述類似,定量描述亦屬于描述性理解,只是更側(cè)重于通過系統(tǒng)化數(shù)據(jù)對社會現(xiàn)象及其過程中的指標(biāo)和簡單關(guān)聯(lián)進(jìn)行描繪。例如,涂爾干在《自殺論》中比較法國與其他歐洲國家的自殺率,以揭示不同自殺類型與社會整合程度(如婚姻、宗教)之間的系統(tǒng)關(guān)聯(lián),從而呈現(xiàn)共變關(guān)系背后的社會機(jī)制(Durkheim,2005/1952)。又如芝加哥學(xué)派的帕克(Robert E. Park)和伯吉斯(Ernest W. Burgess)在《城市》(The City)中結(jié)合人口普查、地圖繪制與田野調(diào)查,繪制著名的“同心圓模型”,用來描述芝加哥城市擴(kuò)張的結(jié)構(gòu)分層及不同區(qū)域中群體互動(dòng)關(guān)系的差異(Park & Burgess,2019/1925)。總體而言,在缺乏現(xiàn)代統(tǒng)計(jì)回歸與因果推斷工具的條件下,早期定量研究在通過展示變量的統(tǒng)計(jì)特征以實(shí)現(xiàn)描述性理解時(shí),也在努力借助簡單的共變關(guān)系分析嘗試邁向解釋性理解。這一做法雖不夠嚴(yán)謹(jǐn),但為定量研究的后續(xù)發(fā)展奠定了基礎(chǔ)。

      定性描述與定量描述的理解取向,體現(xiàn)了研究者在精確性與廣泛性之間的權(quán)衡。定性描述往往將現(xiàn)象成因的探索嵌入“敘事”過程,注重對符號與語義系統(tǒng)的多層次闡釋,在理解個(gè)體行為意義與社會情境復(fù)雜互動(dòng)的基礎(chǔ)上提煉概念、建構(gòu)理論。然而,在形成宏觀普遍結(jié)論時(shí),定性描述常需依賴推論,或承擔(dān)較高的調(diào)查成本。相比之下,定量描述通過“描述變量”對樣本特征及相關(guān)關(guān)系進(jìn)行提綱挈領(lǐng)地刻畫,以期形成具有普遍適用性的解釋方案,在效率和可比性方面具有優(yōu)勢,但過度簡化的數(shù)據(jù)形式也可能導(dǎo)致微觀經(jīng)驗(yàn)被忽視,從而削弱對社會現(xiàn)象復(fù)雜性的把握。更重要的是,若定量描述僅停留于特征和分布的靜態(tài)呈現(xiàn),或局限于二元變量關(guān)系的簡單展示,往往難以揭示社會現(xiàn)象發(fā)生的機(jī)制邏輯,更難以支撐理論生成。正因如此,致力于實(shí)現(xiàn)解釋性理解的新型研究方法逐步超越了過去單純的數(shù)據(jù)描述路徑。

      (二)定量描述的式微

      為實(shí)現(xiàn)韋伯所倡導(dǎo)的解釋性理解,定量分析逐漸將重心轉(zhuǎn)向?qū)σ蚬麢C(jī)制的揭示。《美國社會學(xué)雜志》(American Journal of Sociology,以下簡稱AJS)在創(chuàng)刊時(shí)即指出,雖然社會學(xué)方法的第一步是描述性分析,但第二步因果分析更為重要、有趣且富有挑戰(zhàn)(Barringer et al.,2013)。19世紀(jì)末到20世紀(jì)初,受技術(shù)條件所限,研究者難以識別變量間的時(shí)序與機(jī)制,只能“退而求其次”地依賴簡單的變量描述和相關(guān)分析來把握社會現(xiàn)象。20世紀(jì)40年代以來,多元統(tǒng)計(jì)回歸模型的興起為社會學(xué)家在一定前提假設(shè)下進(jìn)行因果識別提供了可能。定量研究者逐漸從描述性統(tǒng)計(jì)和二元相關(guān)分析,轉(zhuǎn)向利用多元回歸模型控制干擾因素、揭示關(guān)聯(lián)乃至因果關(guān)系,并進(jìn)一步發(fā)展出諸多處理內(nèi)生性問題的因果推斷方法(陳云松、范曉光,2010)。在此演進(jìn)中,定量描述曾試圖承擔(dān)的解釋性理解功能迅速被日益發(fā)展的模型化因果分析所取代。

      傳統(tǒng)定量描述之所以式微,根本原因在于其高度依賴極值、均值、標(biāo)準(zhǔn)誤等有限的統(tǒng)計(jì)特征值對變量屬性進(jìn)行概括,難以深入揭示社會現(xiàn)象及其內(nèi)在機(jī)制,因此被視為缺乏解釋力與理論啟發(fā)性。然而,描述方法本身并不等同于淺層的統(tǒng)計(jì)呈現(xiàn)。在定性研究傳統(tǒng)中,描述始終具備直接啟發(fā)理論的能力。韋伯提出的“理想類型”在邏輯上甚至近似于回歸模型的反事實(shí)思維:通過比較經(jīng)驗(yàn)中難以實(shí)現(xiàn)的理想建構(gòu)(如“君子”)與實(shí)際觀察對象(如“普通讀書人”),提出“適當(dāng)原因”概念,來說明特定條件如何提高某一結(jié)果相對于理想類型的發(fā)生概率(Weber,1951;Barringer et al.,2013)。不過,韋伯運(yùn)用理想類型并非為了概率計(jì)算,而是借助這種理想化比較來揭示現(xiàn)象的意義邏輯,從而進(jìn)入解釋層面。由此可見,在定性研究中,描述方法既是理論發(fā)現(xiàn)的起點(diǎn),也是生成解釋的橋梁甚至“助產(chǎn)士”,始終居于研究方法的核心位置。與之形成對比的是,定量研究的發(fā)展過程實(shí)則導(dǎo)致了變量描述與機(jī)制解釋的逐漸分化。

      定量研究對機(jī)制解釋的追求,大致經(jīng)歷了從二元相關(guān)分析、多元回歸模型到因果推斷的演進(jìn)過程。其中,基于多元回歸模型的關(guān)聯(lián)分析與基于高級計(jì)量模型的因果推斷,既是緊密相連,又代表著對因果關(guān)系的不同理解路徑,二者分別對應(yīng)“穩(wěn)健依賴”與“干預(yù)操控”(Goldthorpe,2001)。“穩(wěn)健依賴”強(qiáng)調(diào)通過穩(wěn)定的變量關(guān)系識別因果機(jī)制,代表性方法包括拉扎斯菲爾德(Paul F. Lazarsfeld)發(fā)展的通過變量控制提升因果推斷有效性的多元回歸(Lazarsfeld,1958),以及格蘭杰(Clive W. J. Granger)利用時(shí)間序列模型識別因果方向的探索(Granger,1969)。該路徑體現(xiàn)了驗(yàn)證主義的基本立場:若某一關(guān)系在控制干擾變量后仍保持統(tǒng)計(jì)顯著,則可被視為“穩(wěn)健因果”。然而,這類方法依賴對潛在干擾因素的充分識別與測量,在數(shù)據(jù)受限或理論尚未明晰時(shí),往往難以深入把握因果過程,也無法真正解決內(nèi)生性問題。相較之下,“干預(yù)操控”將因果視為條件干預(yù)所引發(fā)的結(jié)果變化(Holland,1986),代表著更為嚴(yán)格且被廣泛視為更重要的因果推斷路徑,其典型思路是魯賓(Donald B. Rubin)提出的反事實(shí)框架,通過比較現(xiàn)實(shí)中的結(jié)果與假設(shè)未發(fā)生干預(yù)的反事實(shí)結(jié)果來估計(jì)因果效應(yīng)(Rubin,1974)。在實(shí)踐中,研究者依此發(fā)展出工具變量、赫克曼模型、自然實(shí)驗(yàn)、斷點(diǎn)回歸、雙重差分、多重差分等一系列方法,以處理遺漏變量偏誤、自選擇偏誤和雙向因果等內(nèi)生性問題(陳云松、范曉光,2010;謝宇,2024),從而逐步接近對解釋機(jī)制的完全認(rèn)知。

      盡管簡單關(guān)聯(lián)描述已不足以支持因果判斷,但因果推斷仍依賴對情境與制度環(huán)境的充分呈現(xiàn),以此作為解釋線索(Goldthorpe,2001)。因此,描述方法并未被上述兩條路徑排斥。但是,在社會科學(xué)研究實(shí)踐中,解釋逐漸被收縮為“識別因果效應(yīng)”的單一目標(biāo),而這一目標(biāo)難以通過傳統(tǒng)定量描述實(shí)現(xiàn),導(dǎo)致描述方法被逐漸邊緣化于因果推斷的核心環(huán)節(jié)之外。具體而言,在“穩(wěn)健依賴”路徑中,由于數(shù)據(jù)覆蓋有限,研究者難以呈現(xiàn)所有可能影響結(jié)果的情境因素,也無法充分控制各類不可觀測變量,因此難以確定某一結(jié)果的穩(wěn)健原因。在“干預(yù)操控”路徑中,與自然科學(xué)可以在實(shí)驗(yàn)室中設(shè)定并細(xì)致描述干預(yù)條件不同,社會科學(xué)面對的是復(fù)雜且動(dòng)態(tài)的社會系統(tǒng),研究者既不能完全控制結(jié)果生成過程,亦難以有效比對現(xiàn)實(shí)觀察與反事實(shí)結(jié)果。在此背景下,關(guān)聯(lián)分析側(cè)重回歸模型設(shè)定和控制變量選取,因果推斷則致力于尋找外生沖擊,甚至開展實(shí)驗(yàn)以識別“凈效應(yīng)”,描述似乎日益淪為與解釋脫節(jié)的程式化步驟,其理論價(jià)值不斷被削弱。

      (三)重啟定量描述的動(dòng)因

      因果推斷方法的成熟固然顯著提升了定量研究的解釋能力,但對描述的輕視也帶來新的局限:若固守程式化的因果識別路徑,定量研究可能弱化對新規(guī)律的敏銳捕捉、對深層結(jié)構(gòu)特征的識別以及對理論創(chuàng)新的啟發(fā)作用。這種潛在的理論貧乏促使學(xué)界重新審視描述的價(jià)值。特別是,厚描方法在描述性理解與解釋性理解之間的橋梁作用啟示我們,定量描述完全有可能重返研究的核心,只要它能在因果推斷之前,為研究對象提供更清晰的結(jié)構(gòu)刻畫與情境定位,或在傳統(tǒng)描述與因果解釋之間建立起更具建設(shè)性的連接。對結(jié)構(gòu)和關(guān)聯(lián)的系統(tǒng)描述,雖不能替代解釋性理解,卻足以催生概念、啟發(fā)理論,佐證全局關(guān)聯(lián)甚至為因果推斷提供線索。

      隨著描述對象在數(shù)據(jù)規(guī)模和類型上的持續(xù)擴(kuò)張,以及描述方法本身的日益多元,定量描述的功能正迎來重新界定的契機(jī)。這一轉(zhuǎn)向主要源于三方面推動(dòng):方法論層面的持續(xù)反思、對定性研究的參考借鑒,以及數(shù)據(jù)資源和技術(shù)條件的不斷成熟。對定量描述的再次呼喚,有望推動(dòng)社會科學(xué)在認(rèn)識論層面實(shí)現(xiàn)更新,并促使研究者更積極地融合跨學(xué)科的方法與技術(shù)。由此,定量描述與因果分析或可超越長期以來“淺顯”與“深刻”的二元對立,走向并行協(xié)作的知識生產(chǎn)路徑。

      首先是針對因果分析程式化的反思。越來越多社會科學(xué)家開始警惕因果分析實(shí)踐中的程式化傾向。受美國實(shí)證主義傳統(tǒng)影響,對自變量與因變量之間變量關(guān)系的強(qiáng)度與統(tǒng)計(jì)顯著性的檢驗(yàn)日益成為定量研究的核心焦點(diǎn),這可能導(dǎo)致社會科學(xué)對現(xiàn)實(shí)世界認(rèn)知的滯后(Savage & Burrows,2007)。作為該體系的關(guān)鍵工具,因果分析技術(shù)雖提升了研究的科學(xué)性與規(guī)范性,卻也不可避免地簡化了事件生成過程、預(yù)設(shè)了理想社會環(huán)境;其技術(shù)復(fù)雜性甚至在某些語境下成為評判研究優(yōu)劣的單一標(biāo)準(zhǔn),從而抑制了新思想的涌現(xiàn)與傳播。在此背景下,學(xué)者重新發(fā)掘定量描述的潛力,嘗試借助更宏大的時(shí)空視野、更豐富的指標(biāo)體系、更結(jié)構(gòu)化的刻畫方式與更靈活的可視化工具,在既定因果識別框架之外開拓一條旨在發(fā)現(xiàn)新現(xiàn)象和揭示結(jié)構(gòu)模式的知識生產(chǎn)路徑(陳云松,2022;Savage,2024)。

      社會科學(xué)家也從社會科學(xué)各分支乃至自然科學(xué)的定量研究中汲取經(jīng)驗(yàn),進(jìn)一步反思描述在知識生產(chǎn)中的基礎(chǔ)作用。在社會科學(xué)的部分領(lǐng)域(尤其是在人口學(xué))以及若干自然科學(xué)學(xué)科中,結(jié)構(gòu)性與過程性描述往往占據(jù)核心位置,甚至直接構(gòu)成研究的主要結(jié)論。例如,人口學(xué)通過對婚姻狀況、代際流動(dòng)趨勢等現(xiàn)象的描述揭示中國社會結(jié)構(gòu)的深層變遷(Xie et al.,2022);臨床醫(yī)學(xué)與護(hù)理學(xué)則借助病情發(fā)展的描述性分析追溯病因(Fisher & Marshall,2009)。受此類研究啟發(fā),以戈德索普為代表的學(xué)者在“穩(wěn)健依賴”和“干預(yù)操控”之外提出了“生成過程”的因果觀,強(qiáng)調(diào)應(yīng)通過過程性與結(jié)構(gòu)性的細(xì)致描繪來展現(xiàn)因果的運(yùn)作邏輯,并指出任何單一因素均不足以完全決定結(jié)果,因而因果推斷必須建立在對各類潛在因素的全面考察之上(Goldthorpe,2001)。這一思路延續(xù)了涂爾干、韋伯、馬克思等經(jīng)典社會理論家關(guān)于多重因果與辯證因果的思想傳統(tǒng),使定量描述不僅成為界定因果可能性的重要條件,也因其對因果線索的系統(tǒng)梳理與識別,成為研究發(fā)現(xiàn)的關(guān)鍵來源。

      其次是對定性研究方法的借鑒。人文學(xué)科中的定性研究方法為定量描述的深化提供了重要參照。如前所述,厚描強(qiáng)調(diào)在敘述性描述中展現(xiàn)行動(dòng)背后多層嵌套的意義結(jié)構(gòu),幫助跨文化讀者理解文化實(shí)踐的象征邏輯與意義密碼。費(fèi)孝通的“行行重行行”系列研究也表明,需通過跨地域材料的積累和情境的細(xì)致呈現(xiàn),才能揭示隱藏在日常實(shí)踐背后的穩(wěn)定意義線索(費(fèi)孝通,2014)。與此呼應(yīng),賀雪峰(2014)提出的“飽和經(jīng)驗(yàn)法”主張不預(yù)設(shè)問題、反復(fù)進(jìn)入現(xiàn)場、持續(xù)累積材料,在反復(fù)體察與修正中形成對經(jīng)驗(yàn)的整體把握。

      無論是厚描的意義細(xì)讀,還是飽和經(jīng)驗(yàn)法對經(jīng)驗(yàn)質(zhì)感的塑造,都表明描述具備剖析結(jié)構(gòu)、呈現(xiàn)規(guī)律、催生理論的能力。特別是通過材料的持續(xù)積累、切分與比較,描述可使原本隱性的、局部的、個(gè)體層面的結(jié)構(gòu)模式與意義邏輯逐漸顯現(xiàn),并在此基礎(chǔ)上累積、躍遷,形成超越表面現(xiàn)象的理論生產(chǎn)邏輯和學(xué)術(shù)分析潛力。這一描述邏輯為定量描述的重構(gòu)提供了重要啟示:一方面,可借助數(shù)據(jù)挖掘方法進(jìn)行模式提取與結(jié)構(gòu)識別,揭示數(shù)據(jù)內(nèi)部潛藏的社會結(jié)構(gòu),從而拓展描述在結(jié)構(gòu)層面的分析深度;另一方面,通過在不同樣本、層級、地域與文化情境中開展持續(xù)、局部的觀察與比較,使?jié)撛陉P(guān)聯(lián)在多種經(jīng)驗(yàn)條件下反復(fù)呈現(xiàn)和累加,進(jìn)而增強(qiáng)描述結(jié)果在整體層面的穩(wěn)健性。這種穩(wěn)健性雖不等同于因果,但往往能導(dǎo)向因果、助產(chǎn)理論。如果從這一角度拓展描述的維度,定量描述有望重新在知識生產(chǎn)中發(fā)揮核心作用。

      最后是對新型數(shù)智資源的運(yùn)用。數(shù)智時(shí)代社會數(shù)據(jù)的持續(xù)積累與算法技術(shù)的迅速發(fā)展,為定量描述方法的功能拓展提供了前所未有的支撐。隨著日常活動(dòng)通過智能終端不斷被數(shù)字化,文本、圖像、音頻、視頻與空間軌跡等多模態(tài)信息得以持續(xù)積累,逐漸構(gòu)成現(xiàn)實(shí)社會的“數(shù)字孿生”。定量描述得以在變量維度更高、觀察層級更豐富的數(shù)據(jù)環(huán)境中展開,從而顯著提升社會現(xiàn)象探索的深度并拓展其廣度。所謂“深度”,在此指從復(fù)雜的多模態(tài)數(shù)據(jù)中清晰呈現(xiàn)社會現(xiàn)象的時(shí)空結(jié)構(gòu)及其潛在關(guān)聯(lián),這接近胡塞爾(Edmund Husserl)的表述,即通過系統(tǒng)的方法操作,使原本被表層經(jīng)驗(yàn)遮蔽的結(jié)構(gòu)逐步變得清晰可讀(Husserl,1970:32)。在方法層面,跨時(shí)間與跨區(qū)域的數(shù)據(jù)整合有助于更完整地呈現(xiàn)社會時(shí)空結(jié)構(gòu)的長期變遷趨勢;同時(shí),通過展示多維度指標(biāo)之間的共變關(guān)系,能夠拓展對非線性或隱性關(guān)系等復(fù)雜關(guān)系形態(tài)的觀察視角,從而為描述性理解過渡到解釋性理解提供關(guān)鍵的經(jīng)驗(yàn)線索。所謂“廣度”,則指定量描述在社會現(xiàn)象類型上的覆蓋范圍與多樣程度。傳統(tǒng)問卷和實(shí)驗(yàn)所獲數(shù)據(jù)往往體量有限、覆蓋面狹窄,難以觸及彌散性的文化議題。而互聯(lián)網(wǎng)平臺通過在線問卷和實(shí)驗(yàn)顯著擴(kuò)大了可觀測樣本規(guī)模,并持續(xù)產(chǎn)出網(wǎng)絡(luò)日志、交易記錄、社交媒體文本與傳感器軌跡等,全面記錄了數(shù)十億人跨越時(shí)空的社會交往實(shí)踐及其衍生的話語、觀念等文化建構(gòu)。通過對多模態(tài)材料的持續(xù)積累與結(jié)構(gòu)化分析,數(shù)據(jù)深描得以在更大尺度與更多維層面上呈現(xiàn)社會現(xiàn)象的時(shí)空結(jié)構(gòu)與潛在關(guān)系,其能力突破了傳統(tǒng)描述性統(tǒng)計(jì)的局限。

      三、數(shù)智時(shí)代的數(shù)據(jù)深描

      在數(shù)智時(shí)代,信息載體與分析工具的全面更新,為描述在定量社會科學(xué)研究中的回歸提供了現(xiàn)實(shí)基礎(chǔ)。在此背景下,定量描述已不再停留于表層特征的簡單呈現(xiàn),而是逐步發(fā)展為“數(shù)據(jù)深描”,進(jìn)一步拓展了知識生成的路徑。下文將對數(shù)據(jù)深描進(jìn)行概念化界定,從四個(gè)具體進(jìn)路展開系統(tǒng)論述。

      (一)數(shù)據(jù)深描的定義

      本文以“數(shù)據(jù)深描”指代一類定量研究方法,這類方法運(yùn)用多模態(tài)數(shù)據(jù)與智能算法等技術(shù),對社會現(xiàn)象及其過程的時(shí)空結(jié)構(gòu)與潛在關(guān)系進(jìn)行清晰呈現(xiàn)。它秉承韋伯所界定的“描述性理解”傳統(tǒng),研究目標(biāo)并非傳統(tǒng)的假設(shè)檢驗(yàn),研究路徑也不依賴基于回歸模型的參數(shù)估計(jì)或基于高級計(jì)量方法的因果推斷。

      參照《牛津社會學(xué)詞典》對“描述”的廣義界定,本文提出,數(shù)據(jù)深描包含以下四種研究進(jìn)路:以可視化描述發(fā)現(xiàn)社會結(jié)構(gòu),通過直觀、豐富的視覺呈現(xiàn),清晰揭示復(fù)雜密集數(shù)據(jù)中的整體格局與內(nèi)部差異,增強(qiáng)結(jié)構(gòu)感知的“景深”;以隱性變量描述構(gòu)建新社會指標(biāo),將抽象社會現(xiàn)象轉(zhuǎn)化為可測量、可比較的分析對象,拓展概念測量的“進(jìn)深”;以局部描述累積呈現(xiàn)穩(wěn)定共變關(guān)系,在飽和材料中反復(fù)識別相關(guān)關(guān)系,通過從局部到總體的疊加,形成穩(wěn)定關(guān)系的“層深”;以潛在因果描述啟發(fā)研究假設(shè),運(yùn)用算法模型梳理多變量關(guān)聯(lián)結(jié)構(gòu),勾勒可能的作用鏈條,為后續(xù)解釋提供“縱深”。為更清晰地闡明數(shù)據(jù)深描的定位,下文將其與三類傳統(tǒng)研究方法進(jìn)行對比分析。

      第一,與傳統(tǒng)以描述性統(tǒng)計(jì)方法為核心的定量描述相比,數(shù)據(jù)深描在數(shù)據(jù)來源與分析方式上均實(shí)現(xiàn)了顯著拓展。在數(shù)據(jù)層面,傳統(tǒng)定量描述主要依賴問卷調(diào)查與官方統(tǒng)計(jì)數(shù)據(jù),數(shù)據(jù)的規(guī)模和類型較為有限;數(shù)據(jù)深描則整合調(diào)查數(shù)據(jù)與文本、圖像、音頻、視頻與空間軌跡等多模態(tài)信息,將描述對象所依托的材料從有限樣本擴(kuò)展至規(guī)模更大、結(jié)構(gòu)更復(fù)雜的數(shù)據(jù),從而更全面地展現(xiàn)整體社會情境。在方法層面,傳統(tǒng)定量描述多集中于均值、比例、方差等統(tǒng)計(jì)特征的展示,難以系統(tǒng)反映多變量特征及其相互關(guān)系的整體結(jié)構(gòu);數(shù)據(jù)深描則進(jìn)一步引入計(jì)算方法,對多模態(tài)數(shù)據(jù)中不同變量的結(jié)構(gòu)特征與關(guān)聯(lián)模式進(jìn)行系統(tǒng)性刻畫,尤其注重通過可視化增強(qiáng)結(jié)構(gòu)表達(dá)的清晰度。

      第二,與以厚描為代表的定性描述相比,數(shù)據(jù)深描與定性厚描在材料結(jié)構(gòu)、分析邏輯與知識目的上存在本質(zhì)區(qū)別。定性厚描以生活史、儀式、符號與地方知識等“文本”為基礎(chǔ),致力于闡釋其背后的意義框架(Geertz,1973:6、452)。厚描之“厚度”源于對材料的逐層展開,指向行動(dòng)者的意義世界,旨在生成解釋性理解。數(shù)據(jù)深描的材料則由大規(guī)模、多模態(tài)行為數(shù)據(jù)構(gòu)成,其“深度”源自對數(shù)據(jù)結(jié)構(gòu)的持續(xù)挖掘,包括特征維度拆解、結(jié)構(gòu)模式提取等在內(nèi)的直接服務(wù)于結(jié)構(gòu)呈現(xiàn)的數(shù)據(jù)分析方法,仍屬于描述性理解的范疇。盡管數(shù)據(jù)深描通過局部描述累積識別全局層面穩(wěn)定關(guān)聯(lián)這一進(jìn)路,與厚描在方法邏輯上有一定相通之處,但其研究重心在于整體呈現(xiàn)社會現(xiàn)象及其過程的時(shí)空結(jié)構(gòu)與相關(guān)關(guān)系,并不涉及對因果機(jī)制的探討。數(shù)據(jù)深描因此形成了一條與厚描并行的知識探索路徑。

      第三,與以回歸模型為代表的因果分析相比,數(shù)據(jù)深描并不以因果效應(yīng)的解釋與驗(yàn)證為目標(biāo),而是通過對結(jié)構(gòu)與關(guān)聯(lián)的系統(tǒng)呈現(xiàn),探索并提示可能的關(guān)聯(lián)與因果路徑。例如,數(shù)據(jù)深描可基于算法模型(Breiman,2001),在不預(yù)設(shè)變量關(guān)系的前提下,比較變量的預(yù)測貢獻(xiàn)及其交互結(jié)構(gòu),從而推測因果的可能線索。尤其在可解釋性機(jī)器學(xué)習(xí)的輔助下,研究者能夠直觀把握各變量在預(yù)測結(jié)構(gòu)中的相對位置與作用方式,進(jìn)而生成具有解釋潛力的假設(shè)。數(shù)據(jù)深描并不從屬于因果分析,也不旨在取代因果分析,其所揭示的穩(wěn)定關(guān)系結(jié)構(gòu),既可獨(dú)立作為研究結(jié)論,又能為后續(xù)的因果識別提供探索性基礎(chǔ),從而在通往解釋性理解的研究進(jìn)程中發(fā)揮重要的橋梁作用。

      (二)數(shù)據(jù)深描的進(jìn)路

      在闡明數(shù)據(jù)深描的概念內(nèi)涵后,本文將從其功能深化的不同維度出發(fā),系統(tǒng)闡述四種研究進(jìn)路。這四種進(jìn)路均屬于描述性理解范疇,前兩者側(cè)重于結(jié)構(gòu)呈現(xiàn),后兩者則導(dǎo)向因果線索的發(fā)現(xiàn),共同構(gòu)成一個(gè)遞進(jìn)的連續(xù)體。四種進(jìn)路共同拓展了定量描述的功能,旨在提升對復(fù)雜社會現(xiàn)象的表達(dá)深度與解釋潛力。本文通過梳理中外相關(guān)研究,分別說明各進(jìn)路的應(yīng)用形態(tài),以此呈現(xiàn)數(shù)據(jù)深描在社會科學(xué)知識發(fā)現(xiàn)中所具備的方法價(jià)值。

      1.以可視化方式展陳社會結(jié)構(gòu)

      可視化方法通過直觀且富有美感的表達(dá)方式,在有限的視覺空間中整合多維信息,增強(qiáng)定量描述對社會現(xiàn)象結(jié)構(gòu)層級與時(shí)空分布的呈現(xiàn)能力,從而提升對社會結(jié)構(gòu)感知的“景深”。當(dāng)圖像的尺寸、顏色、形狀與數(shù)據(jù)分布形成協(xié)調(diào)的視覺對應(yīng)時(shí),科學(xué)發(fā)現(xiàn)的表達(dá)將更為鮮明生動(dòng)。相較于以觀察記錄為核心的自然科學(xué),社會科學(xué)中的可視化多用于整理統(tǒng)計(jì)結(jié)果與輔助理解復(fù)雜模型。盡管密度圖、等值線圖、箱型圖等較復(fù)雜的圖表形式已得到應(yīng)用,但模型結(jié)果仍常以表格呈現(xiàn),因?yàn)橹庇^圖像常被認(rèn)為過于簡單、難以承載多維信息,顯得過于簡化(Healy & Moody,2014)。

      隨著互聯(lián)網(wǎng)痕跡數(shù)據(jù)與大規(guī)模文本數(shù)據(jù)的廣泛應(yīng)用,社會科學(xué)研究所面對的數(shù)據(jù)復(fù)雜性顯著提升,已超出傳統(tǒng)方法的處理范疇。研究者因而需要借助無監(jiān)督學(xué)習(xí)等智能方法對數(shù)據(jù)進(jìn)行系統(tǒng)挖掘,并通過計(jì)算與表達(dá)相結(jié)合的方式,呈現(xiàn)社會現(xiàn)象及其過程的結(jié)構(gòu)與分布。可視化方法因而能夠在有限的視覺空間中提升信息密度、降低理解成本,使關(guān)鍵結(jié)構(gòu)線索得以清晰呈現(xiàn)與有效傳遞,從而深化對社會結(jié)構(gòu)的理解。本文從單一變量特征與多變量關(guān)系結(jié)構(gòu)兩個(gè)維度,對相關(guān)代表性研究進(jìn)行系統(tǒng)梳理(詳見表1)。


      在數(shù)據(jù)深描的研究路徑中,對單一變量結(jié)構(gòu)的可視化呈現(xiàn)是常見形式之一。此類研究多通過時(shí)間趨勢圖、區(qū)域分布圖與熱力圖等方式,刻畫特定議題、概念或情緒的時(shí)間演變與空間分布。隨著可視化技術(shù)的發(fā)展,部分研究進(jìn)一步運(yùn)用桑基圖等強(qiáng)調(diào)流動(dòng)性的圖形及視頻等動(dòng)態(tài)形式,呈現(xiàn)信息、資源或話語在不同時(shí)空節(jié)點(diǎn)間的轉(zhuǎn)移與擴(kuò)散過程。

      在多變量關(guān)系結(jié)構(gòu)的呈現(xiàn)方面,復(fù)雜可視化方法同樣發(fā)揮著重要作用。早在《區(qū)隔》(Distinction)中,布迪厄(Pierre Bourdieu)便通過多重對應(yīng)分析將社會地位與生活方式相連接,成為關(guān)系結(jié)構(gòu)可視化的經(jīng)典范例(Bourdieu,1984)。近年來,相關(guān)描述方法持續(xù)拓展,例如將詞向量投影至語義空間以呈現(xiàn)概念間的距離與聚類關(guān)系,或借助社會網(wǎng)絡(luò)分析刻畫個(gè)體與群體間的互動(dòng)結(jié)構(gòu),并結(jié)合聚類結(jié)果及節(jié)點(diǎn)度數(shù)、中心性等指標(biāo)對網(wǎng)絡(luò)形態(tài)進(jìn)行可視化。這類方法有助于直觀呈現(xiàn)關(guān)系結(jié)構(gòu)的整體格局,為理解社會分化與群體差異提供重要的描述性參照。

      2.以數(shù)智方法測量社會指標(biāo)

      概念的操作化是社會科學(xué)研究的關(guān)鍵環(huán)節(jié)。由于理論概念、社會現(xiàn)象與數(shù)據(jù)測量之間常存在差距,研究者往往面臨測量不足的挑戰(zhàn)。在定量研究中,測量指標(biāo)通常需轉(zhuǎn)化為邊界清晰、可操作的變量,以作為宏大社會現(xiàn)象的局部映射。受傳統(tǒng)定量研究微觀旨趣的影響,加之技術(shù)條件限制下宏觀數(shù)據(jù)的缺乏,此類測量多集中于微觀層面的可觀測行為變量(陳云松,2022)。

      數(shù)據(jù)深描旨在建立一種從非結(jié)構(gòu)化數(shù)據(jù)到社會指標(biāo)的生成邏輯。該邏輯依托大規(guī)模數(shù)據(jù)與計(jì)算方法,通過將抽象社會概念拆解為可觀測的多維結(jié)構(gòu),推動(dòng)測量從依賴單一代理變量轉(zhuǎn)向?qū)ι鐣F(xiàn)象內(nèi)部構(gòu)成與總體特征的系統(tǒng)刻畫,這顯著提升了社會測量在描述層面的“進(jìn)深”。一方面,數(shù)據(jù)深描方法可對個(gè)體層面的海量調(diào)查數(shù)據(jù)和行為數(shù)據(jù)進(jìn)行多維整合,豐富微觀指標(biāo)的表達(dá)維度并在統(tǒng)一的多維描述空間中系統(tǒng)呈現(xiàn)原本分散的行為與心態(tài)變量,從而增強(qiáng)對個(gè)體差異及其潛在關(guān)聯(lián)結(jié)構(gòu)的識別能力;另一方面,該方法也使“文化”“心態(tài)”等宏觀概念的直接測量成為可能,使宏觀指標(biāo)能夠更充分地刻畫社會現(xiàn)象的整體特征,并減少對微觀數(shù)據(jù)匯總生成宏觀指標(biāo)的依賴。表2展示了運(yùn)用數(shù)智方法構(gòu)建微觀和宏觀社會指標(biāo)的代表性研究。


      數(shù)智方法為經(jīng)典社會學(xué)概念的測量開辟了新路徑。數(shù)據(jù)深描的代表性研究已開始運(yùn)用生成式人工智能技術(shù),通過對大規(guī)模非結(jié)構(gòu)化文本進(jìn)行語義分析,將文化氛圍、社會心態(tài)等抽象概念轉(zhuǎn)化為可比較的指標(biāo)體系。該方法將非結(jié)構(gòu)化文本映射至統(tǒng)一的語義表示空間,并在相關(guān)社會學(xué)維度上對其進(jìn)行連續(xù)賦值與比較,從而在不依賴人工編碼的前提下,實(shí)現(xiàn)對彌散性社會現(xiàn)象的宏觀測量。

      數(shù)據(jù)深描中的宏觀指標(biāo)側(cè)重于呈現(xiàn)社會現(xiàn)象的結(jié)構(gòu)特征、時(shí)空分布和群體差異;微觀指標(biāo)則通過揭示個(gè)體行為與偏好在不同情境中的分布形態(tài),豐富對社會現(xiàn)象微觀層面的經(jīng)驗(yàn)刻畫。隨著數(shù)智技術(shù)尤其是生成式人工智能的持續(xù)發(fā)展,社會科學(xué)研究將進(jìn)一步整合文本、視頻、圖像、傳感器軌跡與地理信息等多源異構(gòu)數(shù)據(jù),依托大模型的語義映射與連續(xù)賦值能力,對更廣泛的文化氛圍與社會心態(tài)進(jìn)行多維刻畫。通過對這些現(xiàn)象時(shí)空分布特征的持續(xù)描繪,該方法可為突發(fā)事件的實(shí)時(shí)響應(yīng)與精準(zhǔn)治理提供實(shí)證支持。

      3.以局部描述累積全局關(guān)聯(lián)

      如果說社會指標(biāo)的可視化與測量主要對應(yīng)描述性理解的起點(diǎn),那么對變量間關(guān)聯(lián)的局部描述累積則處于通往解釋性理解的后期階段。通過在不同條件的數(shù)據(jù)中反復(fù)呈現(xiàn)同一關(guān)系形態(tài),研究得以從局部觀察中逐步累積出穩(wěn)定的總體關(guān)聯(lián),從而形成關(guān)系理解的“層深”。該方法邏輯不依賴單一案例的闡釋,而是在多種社會情境中反復(fù)呈現(xiàn)關(guān)鍵現(xiàn)象,使相關(guān)關(guān)系在層層比較中逐漸清晰。因此,該進(jìn)路與“穩(wěn)健依賴”的因果思維一脈相承(Goldthorpe,2001),也與費(fèi)孝通、賀雪峰等學(xué)者基于飽和材料的定性研究傳統(tǒng)具有內(nèi)在一致性。

      在結(jié)構(gòu)復(fù)雜的數(shù)據(jù)情境中,傳統(tǒng)因果推斷方法往往在模型設(shè)定與變量控制方面面臨局限(Burrows & Savage,2014),這促使部分研究轉(zhuǎn)向操作成本較低、更為靈活的關(guān)聯(lián)描述路徑。所謂“飽和”,指的是同一關(guān)聯(lián)在時(shí)間、空間、社會因素等存在多重差異的樣本中持續(xù)顯現(xiàn)。借助這類自然差異,研究者可在比較過程中實(shí)現(xiàn)對潛在遺漏變量的非模型化條件控制。即便僅依賴基礎(chǔ)的二元關(guān)聯(lián)描述,通過跨時(shí)期、跨地域或跨群體的多重比較,研究者亦可對穩(wěn)定關(guān)系作出經(jīng)驗(yàn)判斷。該路徑不依賴嚴(yán)格的因果假設(shè),雖不直接識別因果機(jī)制,但能從局部累積至整體,靈活呈現(xiàn)社會結(jié)構(gòu)中的穩(wěn)定關(guān)聯(lián)。表3展示了社會科學(xué)與自然科學(xué)領(lǐng)域中,通過局部描述累積識別全局關(guān)聯(lián)的代表性研究。


      對穩(wěn)定關(guān)系的探索,往往依托大規(guī)模、跨地域的歷史材料,通過長期與跨地域的描述累積,形成對社會結(jié)構(gòu)的整體把握。相較于學(xué)術(shù)論文,社會科學(xué)專著在關(guān)聯(lián)呈現(xiàn)上通常更為細(xì)致,往往綜合運(yùn)用定量數(shù)據(jù)與定性材料,結(jié)合比較分析與歷史分析等方法,從而賦予社會理論跨越時(shí)空的穩(wěn)健性。法國經(jīng)濟(jì)學(xué)家皮凱蒂(Thomas Piketty)的《21世紀(jì)資本論》(Capital in the Twenty-First Century)雖未采用數(shù)智方法,但其基于跨國、跨歷史時(shí)期的大規(guī)模數(shù)據(jù)形成的描述累積,為理解社會結(jié)構(gòu)與長期不平等格局提供了重要的方法啟示(Piketty,2014)。隨著數(shù)智技術(shù)的發(fā)展,已有學(xué)者在著作中進(jìn)一步整合多模態(tài)數(shù)據(jù),對社會現(xiàn)象間的關(guān)聯(lián)進(jìn)行系統(tǒng)性呈現(xiàn)。由此,社會科學(xué)學(xué)者在新的技術(shù)條件下重新接近韋伯、涂爾干等先驅(qū)寫作“鴻篇巨制”的研究理想,既有助于推動(dòng)學(xué)術(shù)研究深化,也有助于促進(jìn)公共知識更新與社會進(jìn)步。

      4.以算法模型預(yù)示潛在因果

      算法模型通過呈現(xiàn)變量預(yù)測貢獻(xiàn)的結(jié)構(gòu)性分布,為變量之間可能存在的關(guān)聯(lián)鏈條提供方向性線索,從而形成導(dǎo)向解釋性理解的“縱深”路徑。由于可預(yù)測性被視為因果機(jī)制成立的“必要不充分條件”(Watts,2014),穩(wěn)定的預(yù)測貢獻(xiàn)結(jié)構(gòu)因而具有因果啟發(fā)意義。當(dāng)變量數(shù)量較多且結(jié)構(gòu)較為復(fù)雜時(shí),傳統(tǒng)回歸模型往往存在預(yù)測性能不佳的問題。而可解釋性機(jī)器學(xué)習(xí)模型能夠有效揭示變量的邊際預(yù)測貢獻(xiàn),推動(dòng)研究由“推理—驗(yàn)證”模式轉(zhuǎn)向以數(shù)據(jù)驅(qū)動(dòng)理論發(fā)現(xiàn)的“預(yù)測—?dú)w納”模式(陳茁、陳云松,2023)。

      “預(yù)測—?dú)w納”的因果預(yù)示路徑通過對數(shù)據(jù)樣本中所有可能解釋變量的預(yù)測貢獻(xiàn)進(jìn)行深描,為識別潛在生成機(jī)制提供了系統(tǒng)性的輸入,最大限度地體現(xiàn)了作為一種“生成過程”的因果思維(Goldthorpe,2001),其實(shí)現(xiàn)路徑包括:對情境變量的整體刻畫,通過監(jiān)督學(xué)習(xí)模型識別復(fù)雜結(jié)構(gòu),以及借助可解釋性機(jī)器學(xué)習(xí)方法拆解模型“黑箱”,比較各變量的邊際預(yù)測貢獻(xiàn),從而識別具有因果分析潛力的關(guān)聯(lián)模式(Lundberg & Lee,2017)。在此過程中,研究者的理論洞見既被用于界定算法模型可納入的變量范圍,也被用于甄別模型結(jié)果,降低數(shù)據(jù)偶然性與過度擬合的風(fēng)險(xiǎn)。數(shù)據(jù)深描的過程亦可能揭示新的關(guān)聯(lián)模式與潛在因果線索,從而進(jìn)一步成為理論洞見的來源。

      當(dāng)前,越來越多社會科學(xué)研究開始運(yùn)用可解釋性機(jī)器學(xué)習(xí)等算法模型對變量預(yù)測貢獻(xiàn)進(jìn)行深描,以探索潛在機(jī)制線索。需注意的是,算法模型輸出的貢獻(xiàn)度并不等同于回歸系數(shù),它是對預(yù)測貢獻(xiàn)的量化刻畫,旨在識別潛在的結(jié)構(gòu)關(guān)系。表4展示了沙普利值解釋法(SHapley Additive exPlanations,簡稱SHAP)和局部可解釋模型無關(guān)方法(Local Interpretable Model-agnostic Explanations,簡稱LIME)在社會科學(xué)中的應(yīng)用案例。


      沙普利值解釋法和局部可解釋模型無關(guān)方法在功能上各有側(cè)重。沙普利值解釋法從整體層面揭示變量預(yù)測貢獻(xiàn)的相對排序,適用于高維、非線性且交互關(guān)系復(fù)雜的社會科學(xué)數(shù)據(jù)情境。局部可解釋模型無關(guān)方法則聚焦于特定樣本的預(yù)測結(jié)構(gòu),旨在揭示個(gè)體層面的決策邏輯(Bueff et al.,2025),因而更常用于個(gè)體層面的可追溯分析,以提高決策透明度,如社會政策評估等場景。可解釋性機(jī)器學(xué)習(xí)方法作為數(shù)據(jù)深描中因果預(yù)示路徑的重要工具,為潛在生成機(jī)制的識別與后續(xù)因果分析提供關(guān)鍵啟示。

      (三)數(shù)據(jù)深描的價(jià)值

      數(shù)據(jù)深描在學(xué)科發(fā)展、知識傳播與社會治理中展現(xiàn)出重要價(jià)值,它有助于突破學(xué)科知識邊界、推動(dòng)知識普及,并為社會治理能力的提升提供新的方法路徑。作為一種方法創(chuàng)新,數(shù)據(jù)深描既能夠回應(yīng)“國之大者”,也能扎根具體的社會實(shí)踐,在知識傳播與轉(zhuǎn)化過程中有效參與社會文明建設(shè)。

      1.學(xué)科發(fā)展價(jià)值

      數(shù)據(jù)深描既回應(yīng)了經(jīng)典理論關(guān)切,也在數(shù)智條件下拓展了中國社會科學(xué)的知識版圖與研究邊界,其學(xué)科發(fā)展價(jià)值主要體現(xiàn)在以下三個(gè)方面。

      一是重返經(jīng)典。韋伯認(rèn)為,社會科學(xué)的認(rèn)識特質(zhì)在于使社會現(xiàn)象在經(jīng)驗(yàn)層面獲得可理解性,而非以因果關(guān)系的確認(rèn)為直接起點(diǎn)(Weber,1978:8-9,15)。數(shù)據(jù)深描正是在此意義上,對韋伯經(jīng)典立場進(jìn)行當(dāng)代定量轉(zhuǎn)化:它不以因果檢驗(yàn)為目標(biāo),而是通過清晰呈現(xiàn)社會現(xiàn)象的結(jié)構(gòu)與關(guān)聯(lián),構(gòu)建可理解的描述性圖景,并為通向解釋性理解提供經(jīng)驗(yàn)線索。

      二是重塑主體。作為一種方法創(chuàng)新,數(shù)據(jù)深描體現(xiàn)了技術(shù)層面的學(xué)術(shù)自覺,更內(nèi)嵌于“如何構(gòu)建中國哲學(xué)社會科學(xué)自主知識體系”的方法自覺之中(陳云松,2025)。依托中國悠久的歷史文脈、廣袤的地理空間以及長期積累的跨時(shí)期、跨層級數(shù)據(jù)資源,數(shù)據(jù)深描能夠系統(tǒng)呈現(xiàn)中華文明在不同歷史時(shí)期與社會條件下的結(jié)構(gòu)形態(tài),為正確理解和大力推進(jìn)中國式現(xiàn)代化提供經(jīng)驗(yàn)參照,并在全球知識體系中提升中國社會科學(xué)作為理論與知識生產(chǎn)者的主體性地位。

      三是拓展邊界。數(shù)據(jù)深描通過整合歷史與當(dāng)代、國內(nèi)與國外等多元經(jīng)驗(yàn)材料,使社會科學(xué)研究能夠在更長時(shí)間尺度與更廣空間范圍內(nèi)比較社會結(jié)構(gòu)與關(guān)聯(lián)模式,為構(gòu)建具有全球視野的中國理論框架奠定經(jīng)驗(yàn)基礎(chǔ)。同時(shí),數(shù)據(jù)深描對數(shù)智技術(shù)與情境理解邏輯的系統(tǒng)運(yùn)用,也有助于推動(dòng)社會科學(xué)與人文學(xué)科、自然科學(xué)之間進(jìn)行更緊密的跨學(xué)科對話。

      2.知識普及價(jià)值

      數(shù)據(jù)深描通過對社會現(xiàn)象進(jìn)行直觀而生動(dòng)的呈現(xiàn),顯著提升了學(xué)術(shù)知識的可讀性,有助于緩解學(xué)術(shù)研究成果向公共認(rèn)知轉(zhuǎn)化長期受限的狀況。其知識普及價(jià)值主要體現(xiàn)在以下方面。

      一是提高公眾素養(yǎng)。數(shù)據(jù)深描能夠?qū)⒊橄髲?fù)雜的研究發(fā)現(xiàn)轉(zhuǎn)化為結(jié)構(gòu)清晰、邏輯可讀的知識形態(tài),為公眾理解數(shù)智時(shí)代的社會現(xiàn)象與開展自主學(xué)習(xí)提供現(xiàn)實(shí)條件,有助于彌合數(shù)智知識層面的認(rèn)知鴻溝。

      二是培育社會興趣。研究議題的專業(yè)性與分析復(fù)雜性,往往構(gòu)成青年人理解社會科學(xué)問題的認(rèn)知門檻。數(shù)據(jù)深描方法在保持學(xué)術(shù)嚴(yán)謹(jǐn)性的同時(shí),有效降低了青年人的理解成本,為青年群體參與公共議題討論與形成科學(xué)的社會認(rèn)知提供了必要的知識支撐。

      三是推動(dòng)文化傳承。在把馬克思主義基本原理同中國具體實(shí)際相結(jié)合、同中華優(yōu)秀傳統(tǒng)文化相結(jié)合的過程中,數(shù)據(jù)深描能夠清晰呈現(xiàn)中華文明的歷史脈絡(luò)與結(jié)構(gòu)特征,為中華優(yōu)秀傳統(tǒng)文化的創(chuàng)造性轉(zhuǎn)化與創(chuàng)新性發(fā)展提供堅(jiān)實(shí)的經(jīng)驗(yàn)支持。

      3.社會治理價(jià)值

      數(shù)據(jù)深描不依賴復(fù)雜理論預(yù)設(shè)和模型設(shè)定,能夠靈活整合非結(jié)構(gòu)化數(shù)據(jù),其結(jié)果呈現(xiàn)也相對直觀。因此,作為一種低成本、可擴(kuò)展的研究模式,數(shù)據(jù)深描能夠?yàn)橹卫頉Q策提供高效支持,其社會治理價(jià)值主要體現(xiàn)在以下方面。

      一是降本增效。相較于對模型設(shè)定與數(shù)據(jù)條件要求較高的因果分析方法,數(shù)據(jù)深描依托真實(shí)社會情境中廣泛且低成本的數(shù)據(jù)來源,通過多維、連續(xù)的分析方式響應(yīng)治理實(shí)踐需求,有助于提升治理決策的執(zhí)行效率與實(shí)際效果。

      二是實(shí)時(shí)響應(yīng)。借助移動(dòng)端體驗(yàn)采樣和傳感器軌跡等多模態(tài)數(shù)據(jù),數(shù)據(jù)深描能夠?qū)崟r(shí)刻畫信息流動(dòng)與社會結(jié)構(gòu)變化,識別社會風(fēng)險(xiǎn)的早期信號及其演化趨勢,從而推動(dòng)社會治理從被動(dòng)應(yīng)對轉(zhuǎn)向主動(dòng)預(yù)警與動(dòng)態(tài)監(jiān)測。

      三是促進(jìn)區(qū)域協(xié)同。不同地區(qū)在社會結(jié)構(gòu)與治理需求上存在差異。數(shù)據(jù)深描通過動(dòng)態(tài)刻畫區(qū)域差異,既可以為國家層面的宏觀決策提供依據(jù),也可以為因地制宜的地方治理提供支持,進(jìn)而促進(jìn)國家與地方在治理層面的有效協(xié)同。

      四、結(jié)語

      皮凱蒂在《21世紀(jì)資本論》中高度贊賞文學(xué)作品對不同階層財(cái)富收入的生動(dòng)展現(xiàn),認(rèn)為簡·奧斯汀(Jane Austen)等小說家所描繪的社會不平等現(xiàn)象“逼真而具有強(qiáng)烈感染力,是任何統(tǒng)計(jì)或理論分析都無法比擬的”(Piketty,2014:2)。薩維奇進(jìn)一步提出,定量描述也應(yīng)具備這種感召力,通過新穎的觀看、閱讀和感受方式,將潛在含義傳遞給讀者(Savage,2024)。數(shù)據(jù)深描正是對這一期待的回應(yīng),它不僅憑借新視角與復(fù)合方法傳遞美學(xué)感知,更通過對表象之下時(shí)空結(jié)構(gòu)和潛在關(guān)系的系統(tǒng)刻畫,使復(fù)雜社會現(xiàn)實(shí)在數(shù)據(jù)層面變得可讀、可感與可理解。

      歷經(jīng)多次論爭,社會科學(xué)界已普遍認(rèn)同因果分析與描述方法應(yīng)互為補(bǔ)充、彼此支撐(Crompton,2008;Gane,2020;Savage,2020)。本文提出的數(shù)據(jù)深描方法在西方“描述轉(zhuǎn)向”討論的基礎(chǔ)上更進(jìn)一步,強(qiáng)調(diào)在數(shù)智時(shí)代的大規(guī)模數(shù)據(jù)與技術(shù)條件下,定量描述已不再只是因果解釋的輔助手段。它能夠在描述性理解框架內(nèi)獨(dú)立承擔(dān)結(jié)構(gòu)識別與關(guān)系探索的任務(wù),并在描述性理解與解釋性理解之間發(fā)揮橋梁作用,從而為韋伯所界定的描述性理解,提供一條植根于當(dāng)代數(shù)智環(huán)境的實(shí)踐進(jìn)路。

      需要說明的是,本文所歸納的四種描述進(jìn)路并未窮盡數(shù)據(jù)深描的所有可能形態(tài)。隨著生成式人工智能等技術(shù)的持續(xù)進(jìn)步,數(shù)據(jù)深描仍具有廣闊的拓展空間。未來,這類方法或可在無需直接進(jìn)入因果推斷的前提下,為解釋性理解提供更為系統(tǒng)而豐富的經(jīng)驗(yàn)線索。數(shù)據(jù)深描的深化發(fā)展,或許正是米爾斯(C. Wright Mills)所倡導(dǎo)的“社會學(xué)的想象力”在新時(shí)代的具體實(shí)踐——通過扎實(shí)的數(shù)據(jù)經(jīng)驗(yàn)把握社會現(xiàn)象的歷史進(jìn)程與結(jié)構(gòu)脈絡(luò),重新激活將個(gè)人困擾與公共議題相聯(lián)結(jié)的想象力(陳云松,2025;馬文、陳云松,2025)。

      習(xí)近平總書記指出:“世界百年未有之大變局加速演進(jìn),世界進(jìn)入新的動(dòng)蕩變革期,迫切需要回答好‘世界怎么了’、‘人類向何處去’的時(shí)代之題……加快構(gòu)建中國特色哲學(xué)社會科學(xué),歸根結(jié)底是建構(gòu)中國自主的知識體系。”對社會科學(xué)而言,這一使命不僅意味著研究議題的拓展或理論立場的重申,更關(guān)鍵的是在方法層面形成清晰而自覺的知識生產(chǎn)路徑。重返描述,并非以描述取代解釋,而是通過豐富和深化描述性分析,為抵達(dá)解釋性理解奠定基礎(chǔ)、搭建橋梁。在這一意義上,數(shù)據(jù)深描超越了單純技術(shù)工具的集合,成為立足數(shù)智時(shí)代、深化描述性理解的一種方法自覺(陳云松,2025)。數(shù)據(jù)深描能夠從中華民族數(shù)千年的歷史文脈與當(dāng)代復(fù)雜社會現(xiàn)實(shí)中,發(fā)掘更具深度的理論線索,為建立具有高度文化自覺的中國范式奠定方法基礎(chǔ)。由此,當(dāng)代定量研究有望既突破思維和方法定式的藩籬,又轉(zhuǎn)化為對現(xiàn)實(shí)的理解與治理能力,進(jìn)而在文化根基與數(shù)智力量的交融中,形成服務(wù)于文明發(fā)展的持續(xù)知識積累。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      社會學(xué)研究雜志 incentive-icons
      社會學(xué)研究雜志
      《社會學(xué)研究》官方帳號
      1104文章數(shù) 954關(guān)注度
      往期回顧 全部

      專題推薦

      洞天福地 花海畢節(jié) 山水饋贈里的“詩與遠(yuǎn)方

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: AV人摸人人人澡人人超碰下载| 亚洲欧美日韩高清一区二区三区| 中文字幕av无码一区二区三区| 成人午夜视频一区二区无码| 五月婷之久久综合丝袜美腿| 国产精品igao视频| 国产一区二区三区啪| 久久久亚洲精品无码| 簧片无码| 亚洲中文字幕不卡| 国内少妇人妻偷人精品视频| 亚洲一区二区精品在线播放| 91亚洲免费视频| 国产精品亚洲专区无码牛牛| 一本久道中文无码字幕av| 91丨九色丨拳交| 中文字幕一区二区久久人妻| 在线观看热码亚洲av每日更新| 2021精品国产自在现线看| 91无码人妻精品一区二区蜜桃| 国产AV无码专区亚洲AV漫画 | 五月天丁香婷婷亚洲欧洲国产| 四虎永久免费在线| 无码不卡av东京热毛片| 国内精品久久久久影院日本| 美女张开腿黄网站免费| 株洲县| 亚洲中文字幕无码永久在线| 91视频在| 精品少妇爆乳无码av无码专区| 亚洲最大成人综合网| 亚洲综合熟女久久久40p| 久久精产国品一二三产品| 啦啦啦高清在线观看视频www| 最大胆裸体人体牲交| 午夜国产理论| 国产成人a在线观看网站站| 武隆县| 日本丰满熟妇videossex一| AV一二三| 亚洲精品国产自在久久|