網易首頁 > 網易號 > 正文申請入駐

佳文回溯｜透視算法黑箱：數字平臺的算法規制與信息推送異質性

2026-04-16 18:17:19　來源: 社會學研究雜志

北京舉報

分享至

劉河慶

華中科技大學

社會學院

副研究員

梁玉成

中山大學

社會學與人類學學院

教授

透視算法黑箱：數字平臺的算法規制與信息推送異質性

來源 | 《社會學研究》2023年第2期

作者 | 劉河慶、梁玉成

責任編輯 | 張志敏

本研究借鑒實驗和逆向工程方法，通過設置若干虛擬賬號與數字平臺進行長時間真實互動，以嘗試真正進入算法的政治化空間，分析算法規制對用戶信息獲取異質性的影響。實證結果揭示了數字時代算法規制的高度復雜化、精細化和隱蔽化。從信息主題維度看，算法增加了個體獲得多樣化主題信息的機會。從信息語義維度看，算法強化了過濾氣泡效應，出現信息推送的窄化和固化，不同個體被算法框定在語義向量空間中相對固定的位置，只被推送特定語義維度的信息。

一、引言

算法無處不在。數字時代，信息呈井噴式爆發，過去留給個體的操作、決策和選擇空間越來越被基于計算機代碼所編寫的算法所取代。算法及其推動的工具、服務和平臺通過處理人工難以處理的海量復雜數據，在眾多領域扮演著愈加重要的角色，成為連接、重組和調解數字社會與真實社會的關鍵部分（Cheney-Lippold，2017）。向用戶推送新聞和短視頻（Bail，2021）、外賣騎手的派單與送餐路線（陳龍，2020）等，都是算法應用的豐富場景。

鑒于算法已成為當代社會生活的重要組成部分，學界迫切需要對算法及其影響給予批判性和經驗性的關注，進而對算法如何重組、調解、動員原有社會關系（Ruppert et al.，2013）及其潛在的影響形成更為清晰的認識。以數字平臺廣泛應用的信息推薦算法為例，信息推薦算法通過自動為用戶篩選和推送信息流，同時影響和塑造個體信息獲取與社會整體的輿論和心態（Perra & Rocha，2019）。與信息推薦算法在數字時代扮演的關鍵角色不匹配的是，目前學界對算法如何具體影響信息的擴散、分化仍有較大爭議。例如，算法究竟是為用戶解鎖高質量的多樣化信息，還是不斷迎合個體喜好而過度推送特定類型的信息，從而將用戶鎖定在單一、狹窄的過濾氣泡之中？超大規模、超高頻次的算法與個體行為的動態互動會將不同個體帶到信息空間中的哪個位置？是否會因此加劇不同用戶間信息的隔離與分化？對上述問題的回答不僅有助于我們厘清算法對個體信息獲得、社會知識生產以及公眾觀念極化等重要議題的影響，而且也是理解作為當代重要技術物的算法如何行使權力以及如何塑造數字時代的社會關系與社會現實的關鍵（Burrell & Fourcade，2021；王天夫，2021）。

對上述問題作出實證回答并不容易。一方面我們所關心的算法通常非常復雜，晦澀難懂，處于不透明、難追蹤的黑箱狀態（Mittelstadt et al.，2016），平臺公司較少詳細公布平臺算法架構或工作細節，研究者直接獲得平臺公司的數據更是難上加難。另一方面，即使研究者擁有足夠的技術基礎且可以獲得部分算法架構或運作細節，仍難以有效分析算法對社會現實的影響，原因在于算法影響社會的突出特征是一種算法介入的社會（algorithmically infused societies）出現（Wagner et al.，2021；Perra & Rocha，2019），具體表現為算法、訓練數據集、外部約束條件以及龐大個體用戶群之間超大規模、超高頻次的循環互動。這種拉圖爾意義上的不同行動者高度復雜的動態網絡（Latour，2005），意味著我們的研究對象不是一個簡單的、確定性的算法黑盒，而是龐大的、網絡化的、與社會現實高頻互動的算法系統（Seaver，2017）。因此，我們不能僅在技術意義上討論算法，也難以僅通過公開的部分算法原理和代碼來準確分析算法的社會影響（Brown et al.，2021），算法的上述特征給社會科學實證研究帶來巨大挑戰。

針對上述難題，本文借鑒實驗和逆向工程方法，將虛擬賬戶作為研究工具，通過對參與主體的屬性進行虛構觀察，關注其與算法、數字平臺的長期交互結果，進而嘗試真正進入算法的政治化空間（Amoore，2020），以此透視算法黑箱，實證分析算法規制對用戶信息獲取異質性的影響效應。具體而言，本文嘗試以T平臺這一高度強調算法的信息推送數字平臺為例，設置155個不同信息點擊行為的虛擬個體賬號，使每個賬號按照設定的點擊偏好與平臺進行25天的持續互動，進而收集不同賬號在該平臺包含233973個推送信息流（news feed）以及超過294萬條具體信息在內的推送信息大數據?；谠摂祿?，本文從信息主題異質性與語義異質性兩個分析維度對比平臺為不同虛擬用戶推送信息的具體結構和內容的異同，進而探討數字時代算法對個體信息獲取和個體間信息分化的潛在影響以及對治理的啟示。

二、文獻評述

（一）算法作為社會權力

算法在計算機科學中通常被理解為“完成給定任務的控制結構”（Beer，2015），然而算法并非在真空中運行，社會科學研究更為關注算法的社會屬性與社會后果（邱澤奇，2017）。例如，算法規制（algorithmic regulation）關注算法在建構社會秩序方面所扮演的角色（Kitchin，2017），楊（Karen Young）和洛奇（Martin Lodch）將算法規制定義為規制某一領域行為的決策系統，其通過對大規模數據進行學習，來管控風險、改變行為，以便實現預定目標（楊、洛奇編，2020）。簡單來說，算法規制即算法依據海量數據對目標群體進行分類（Amoore，2020），根據分類結果進行自動決策，從而替代傳統人工進行的規制，而算法作為社會權力正是來源于上述自動分類和決策過程（Burrell & Fourcade，2021；Thorson et al.，2021）。

與傳統人工對個體的識別和分類不同，算法識別“我們是誰”是由無數詮釋層組成的，分類的目標也有成千上萬個（性別、喜好等），個體隨意點擊或瀏覽行為都可能成為分類決策的一部分（Amoore，2020）?，F實中清晰的身份變成數字平臺中概率化、碎片化以及快速變動的身份，因此算法規制的主要特征就是其動態的模塊化控制（Koopman，2019；段偉文，2019）。在這一過程中算法如何實施權力、基于何種標準決定我們從屬于特定身份的概率則是一個黑箱，難以知曉（Burrell & Fourcade，2021）。另外，算法作為社會權力的表現是其通過概率化輸出的形式將無數不可計算的差異縮減為單個輸出。這可能會將不確定的、個人主觀的、情境性的東西被完全忽略或將其強行作為一個確定的概率呈現，進而導致分類的錯誤和對個體的不公平對待（Amoore，2020）。

如果說算法的分類過程是在“了解”人們的行為，那么算法的決策過程則是在大規模地“塑造”人們的行為，已有對算法決策過程及后果的研究主要關注以下方面。一是商業導向促使算法擁有者通過上癮設計等方式不斷爭奪用戶注意力（Bakshy et al.，2015），這造成假新聞、標題黨、陰謀論等的泛濫（Bucher，2012；孫萍、劉瑞生，2018）；二是算法規制系統精準但卻片面的大規模信息推送，可能會降低信息的多樣化程度以及公共討論的質量，進而影響整個社會的知識生產與觀念結構（陳云松，2022；邱澤奇，2022）；三是算法決策的黑箱化及其潛在風險，用戶沒有充分的解釋和追索權，研究者同樣難以準確評估該算法決策標準的合理性及潛在風險（Perra & Rocha，2019）。

綜上，算法在自動分類和決策中扮演的角色集中體現了數字時代算法權力是通過排除（個體是否從屬于某一類別）與不可見（是否推送特定類型的信息）而非剝削來運作（拉什，2009），但已有研究多是外在地指出上述現象，而對于算法究竟如何具體行使排除和不可見權力以此塑造社會現實，特別是在算法介入的社會這一背景下，算法與不同個體的持續互動所帶來更深層的影響和后果，有待我們真正進入算法空間進行檢驗。另外，關于算法作為社會權力的已有文獻往往籠統地將多種算法合起來討論，針對特定算法深入、系統的實證研究將有助于我們更為準確地理解算法在不同情境下對不同個體的真實影響。

（二）算法規制與個體間信息獲取異質性

算法規制最直接的體現是對信息流的動態控制（Bail，2021）。通過有針對性地為用戶推送信息，信息推薦算法主導著數字時代的信息擴散和流動（Bail，2021；Bakshy et al.，2015；Bucher，2012）。關于算法究竟如何通過排除和不可見權來運作，會如何影響個體的信息獲取以及個體間的信息分化，仍存在較大爭議。已有文獻主要分為“過度個體化”與“分類權力”兩個研究脈絡。

“過度個體化”研究認為，算法依據個體瀏覽記錄等特征為每個個體創造微信息環境，這個微信息環境隨著算法與個體互動的深入會不斷同質化，進而降低個體對多元化信息的偶遇能力（Bakshy et al.，2015）。這通常被描述為信息繭房、回音室（桑斯坦，2008）或過濾氣泡（Pariser，2011）。如帕里瑟（Eli Pariser）認為，臉書、谷歌等平臺使用的算法不斷推測并提供我們感興趣的內容，算法正在創建過濾氣泡，迎合并放大個體偏好，用戶最終可能會被暴露在一幅帶有偏見的、碎片化的世界圖景中，從而加劇信息隔離以及觀念分化（Pariser，2011）。

“分類權力”研究則強調，算法規制將帶來個體主動性的喪失。算法根據預測的個體類別進行內容推送，個體的偏好、主觀意愿并不重要，個體在數字時代無限多維的類別化或指數化對個體信息獲取有著重要的影響（Amoore，2020；Cheney-Lippold，2017）。在數字社會中，方法論的個體主義已被指數化所取代，個體僅僅是不同類別編碼中的一個數字，個體的主觀獨特性、想法不僅沒有被過度重視，反而變得不再重要（Cheney-Lippold，2017）。信息推薦算法的本質是依據對個體的數據標注與畫像將其轉化為無限多維的數據集，進而對相關人群進行更具針對性的內容推薦、目標管理乃至行為引導與控制，個體能獲取的只是算法推測的、你的同類人感興趣的信息（段偉文，2019；韓炳哲，2019）。

上述兩種研究視角討論了算法規制對個體信息獲取和個體間信息分化的可能影響。值得關注的是，在后續算法推薦實踐中，究竟是“過度個體化”還是“分類權力”在起作用，算法是否導致并強化了過濾氣泡效應，個體間產生了何種信息獲取差異等重要議題均未得到普遍的實證支持（Thorson et al.，2021；Bail，2021；葛巖，2020；陳華珊、王呈偉，2019），相關研究陷入碎片化和爭議（施穎婕等，2022）。例如，有研究發現算法會放大個體偏好，導致個體接收信息的窄化以及個體間接收信息的差異程度變大（Bucher，2012）；而另有研究認為過濾氣泡的威脅被夸大了，個性化的影響比通常認為的要小（Nechushtai & Lewis，2019）。索爾森（Thorson Kjerstin）等就發現，相對于用戶自我報告的興趣，在算法上被歸類為對政治感興趣的人更有可能被推送該類信息（Thorson et al. ,2021）。聶靜虹、宋甲子（2020）關于平臺用戶健康信息獲取的研究發現，用戶需最大化主觀能動性才能部分獲得其感興趣的信息，這與算法所標榜的自動化和精準推送相矛盾。

本文認為，之所以出現上述理論與經驗層面的矛盾和張力，重要原因是已有文獻或是不分維度籠統、模糊地開展討論，或是在不同的單一維度討論信息，而信息在研究中被過度壓縮和簡化了(Amoore，2020；Cheney-Lippold，2017；拉什，2009）。信息本身高度復雜，包括信息來源、主題和語義等多個維度；此外，控制著信息分發的數字平臺在商業利益、政府監管、信息熱度等多個因素的影響下（呂鵬等，2022；趙璐，2022），長期面臨信息推送精確性與多樣性的抉擇（Helberger et al.，2018）。深度學習方法的發展使平臺有能力在信息來源、主題等基礎上捕捉更為深層次的信息語義（劉波，2019），以求根據信息的不同維度實現更精細化的信息推送，進而更好地滿足平臺、用戶和政府等各方需求。在此背景下，在研究中區分信息的不同維度，特別是比較不同用戶在粗粒度信息主題與細粒度信息語義兩個維度上信息獲取的差異，有助于我們更為準確地理解數字時代的算法如何通過精細地控制信息流來行使社會權力以及可能帶來的潛在社會后果。

綜上，已有文獻仍有需要深化之處。第一，已有研究多基于單一的信息主題維度來分析推薦算法對信息異質性的影響（Thorson et al.，2021），鮮有研究綜合多個維度分析算法對個體信息獲取的影響。第二，需重視算法的實時性和變動性，長時間持續而非從單個時間點觀察算法與用戶的交互情況有助于檢驗算法對不同個體信息獲取的真實影響。第三，已有研究多采用受訪者自我報告、瀏覽歷史等方式來分析算法的影響，這往往使推薦算法的行為與用戶對內容的偏好相混淆。若要克服用戶點擊行為本身的內生性，理想情況下需要錨定用戶的行為，進而收集平臺推薦算法為不同用戶所推送的完整信息列表。

三、研究設計

（一）數據收集與處理

T平臺作為國內最大的信息分發平臺之一，完全依靠信息推薦算法實現自動內容分發（推送信息包括科技、體育等百余個垂直領域）。從平臺公開的算法推薦原理來看，其算法主要依據用戶行為特征、內容特征和環境特征三個維度，綜合使用協同過濾方法以及深度神經網絡等多種方法進行信息推薦。在其信息推薦實踐中，相關性特征、環境特征、熱度特征和協同特征是重要考量因素（劉波，2019）。除了模型輸入參數以及考慮特征的高度復雜外，T平臺推薦算法的另一特征是實時性和高度變動性，算法根據用戶行為、內容特征以及環境特征等方面的實時變化不斷在線訓練更新模型參數，進而實現信息實時動態推送。

基于上述信息推薦算法的基本原理，考慮到在研究設計中兼顧用戶特征、內容特征、環境特征和算法推薦的實時性與變動性，本研究嘗試設置12個擁有不同信息主題點擊偏好的用戶組（共155個賬號），使其分別按照設定的點擊偏好與平臺進行較長時間的實時互動，收集不同賬號在該平臺的推送信息大數據。

本研究設計流程包括：（1）招募志愿者注冊平臺賬號，注冊完畢后研究者設定不同賬號的信息偏好和點擊行為。使用虛擬賬號的優點在于該方法便于我們按照自己的研究設計設定具體參數。（2）筆者首先通過信息特征預收集器對數據進行預爬取來獲取平臺信息的標簽或分類情況。其次，本研究參考平臺發布的歷年用戶行為報告（報告會從性別、年齡、所在城市級別等角度對用戶進行劃分，并分析不同用戶的信息點擊偏好），將155個個體虛擬賬號分為12組，每組在面對平臺實時推送的信息流時具有不同的信息點擊偏好。（3）表1報告了不同組別賬號的偏好，其中第一組為隨機測試組，包括20個賬號，具體工作機制是面對平臺提供的推送信息流（通常包括14~15條信息），該組賬號均以30%的概率隨機點擊信息流中的信息（沒有偏好的信息類別），繼而自動刷新到下一屏，繼續上述點擊行為（具體流程詳見圖1）；第二組~第九組則參照平臺公布的用戶點擊偏好設置不同的理想用戶類型，如第二組對應的用戶類型為一線、二線城市高年齡段男性用戶（該組賬號會以90%的概率去點擊信息推送流中政治、金融、科技、自然和汽車等五種標簽的信息），第三組對應的用戶類型則為三線、四線、五線及以下城市高年齡段男性用戶（該組賬號會以90%的概率去點擊信息推送流中社會、軍事、歷史、法制、健康、世界等六種標簽的信息）；第十組~第十二組為極端測試組，分別只點擊特定某一類標簽的信息。（4）需要說明的是，本研究設計并不尋求完全復制用戶與平臺的真實互動情況。一方面，用戶自身及平臺的參數均過于復雜，完全復制并不現實；另一方面，本文主要研究的問題是探討算法對用戶信息獲取的異質性影響，通過錨定用戶的信息偏好和點擊行為，持續觀測平臺為不同用戶推送信息的內容變化情況，有助于克服用戶點擊行為本身的內生性，進而更準確地分析平臺算法對信息獲取的影響。

圖1展示了數據的基本收集流程，賬號首先獲得平臺推送的信息流（生成信息流ID），信息流中包括每條信息的ID、標題、摘要、推薦日期和標簽等內容；之后，賬號根據預先設置的標簽點擊偏好，選擇是否點擊推送信息流的信息，生成點擊行為，繼而刷新屏幕，獲取新的信息流，并重復上述流程。在實際研究中，筆者設置了155個個體賬號，連續25天以一定的時間間隔按照設計的信息點擊偏好與平臺互動，并保存推送信息流信息。最終，本研究生成包含233973個推送信息流及其基本特征（包括信息流ID等），以及超過294萬條具體信息及其基本特征（包括標題、摘要、標簽等）在內的多層級數據庫。

（二）數據分析策略與方法

結合已有研究以及平臺算法的實際運作過程，本文嘗試基于信息主題以及信息語義兩個維度對不同用戶獲取的平臺推送信息的差異進行分析。

1.信息主題維度

本研究首先通過對比不同組別推送信息主題分布差異和推送信息流熵指數來測量信息主題異質性。（1）在不同組別推送信息主題分布差異及歷時性變化方面，若支持算法強化過濾氣泡效應，則可以預期，在總體推送結果中，各組別初始設定中偏好的信息主題占比會更高（隨實驗的推進不斷變高），且由于各組具有不同的點擊行為模式，各組被推送的信息主題會存在明顯的差異。（2）本研究借用熵指數對各組別推送信息流中信息類別的結構以及多樣性程度進行分析（Zhang et al.，2017）。如實證結果支持算法強化過濾氣泡效應，則可以預期，偏好信息點擊主題類別多的組別（如第二組）相較于點擊主題類別少的組別（如第十組）被推送信息的熵指數（即信息主題多樣化程度）更高。

2.信息語義維度

相較于信息主題，深層次的信息語義維度的測量更為復雜。通過平臺公開的算法推薦原理可知，平臺通過深度學習等方法將超高維用戶特征和內容特征轉化為低維實數向量，并通過比較用戶向量、內容向量之間的距離來進行信息推送。因此，欲有效分析不同個體推送信息在信息語義維度的異質性，需要測量不同用戶和內容在向量空間中的距離及其動態變化?；诖?，本研究首先嘗試使用文檔向量模型（Doc2vec）對收集的超過294萬條具體信息進行建模。Doc2vec是將詞向量模型（Word2vec）擴展到句子、段落、文檔或特定類別的方法（Le & Mikolov，2014），該方法通過在詞匯上下文信息中引入文檔或文檔屬性變量（Rheault & Cochrane，2018），在文檔或文檔屬性內預測具體的詞匯，從而可使用單個密集向量表示文檔或文檔屬性。本文以平臺推送的每條具體信息的標題和摘要（將兩者合并）作為語料庫，使用Doc2vec模型對該數據進行訓練，設置訓練窗口為5，訓練中使用詞匯的最小出現頻率為10，迭代次數為20次，得到每條推送信息內容的200維實數向量表示。在將上述200維實數向量與每條信息其他特征拼接后，筆者使用PCA降維以及多層次固定效應模型等方法對不同個體獲取信息的語義維度的異質性進行分析。若在語義維度支持算法強化過濾氣泡效應，則可以預期：（1）在組別內部，各個虛擬賬號在語義向量空間中的分布不會混亂無序，而是會較為接近。（2）不同組別的推送信息在語義向量空間中會出現較為明顯的差異和分化。（3）隨著各組虛擬賬號與平臺互動的深入，各組別在語義向量空間中的差異和分化會呈擴大趨勢。

四、基于信息主題異質性的實證分析結果

（一）不同組別推送信息主題分布

本節首先分析12個組別在與平臺較長時間的互動后被推送信息主題的總體分布情況。表2計算了各組別推送主題信息中占比前六的主題及占比。

按照研究設計，第一組為隨機測試組，由表2可見，第一組被推送的政治新聞（news_politics）最多，占比為27.98%，占比排第二~第六的主題標簽分別為“社會”“娛樂”“世界”“歷史”“金融”新聞,占比分別為7.50%、7.31%、5.16%、5.15%、4.62%。第一組被推送的“政治”的占比遠高于其他組（除第二組外）。在與算法互動過程中，第一組并沒有設置特定的信息類別點擊偏好，但由于研究實施初期推送信息流中“政治”的比例較高（詳見表1），若該組賬號以30%的概率隨機點擊推送信息流中的信息，點擊到“政治”類新聞的概率就會相對較高。

表2同時報告了第二組~第十二組推送信息主題分布，上述各組在研究中均有固定的信息點擊偏好，若各組偏好的信息主題出現在前六大類別中，則表2對該主題進行了加粗顯示。從結果來看，一方面，一旦我們設置的賬號偏好點擊特定主題，則從長時間的互動結果看平臺確實會增加這些主題的推送總量，如第三組被推送的“社會”（11.51%）、“世界”（6.98%）、“歷史”（6.21%）等該組偏好主題的比例高于各組均值。但另一方面，從各組推送信息主題分布對比來看，平臺信息推薦算法雖然考慮個體點擊偏好，但各組均未出現因考慮個體點擊偏好而過度推送特定主題信息的情況。以第十組為例，作為極端測試組，該組只點擊“歷史”新聞，在該組最終被推送的信息主題占比中“歷史”排第四（7.55%），僅略高于各組均值（6.16%），并未出現因過度推送而占比過高的情況。同時除第二組和第九組外，各組最終推送結果中占比第一的信息主題均非初設中偏好的信息主題，由此可見，算法并非完全按照個體點擊偏好進行信息推送。最后，盡管各組擁有不同的信息點擊偏好，但各組被推送的信息主題存在較高程度的重疊（如在12個組別中有8組占比第一的信息主題為“政治”，4組占比第一的信息主題為“娛樂”），各組并未因點擊偏好的差異而出現推送主題上的明顯差異和分化。

上述基于信息主題維度的分析結果雖未直接否定算法導致的過濾氣泡效應，但平臺的推薦算法并未出現已有部分文獻強調的過度迎合且放大個體偏好的情況，過濾氣泡的威脅被夸大了（Nechushtai & Lewis，2019），個性化的影響比通常認為的要小。

（二）不同組別信息推送的歷時性變化

本節進一步分析不同組別推送信息主題的歷時性變化，以探索平臺推薦算法與不同組別信息獲取的動態互動情況。圖2以“政治”主題新聞為例，展示了各組別“政治”信息推送占比的動態變化情況，圖2上半部分和下半部分分別呈現第一組~第六組以及第七組~第十二組的情況，橫軸日期代表研究開始天數，縱軸代表各組別被推送的“政治”類主題信息占總體被推送信息的比例。

由圖2可見，在正式研究開始的第一天，各組被推送的“政治”類主題信息的占比相近，均在10%左右，之后各組開始出現差異。首先，針對“政治”類信息點擊量大的組別（第一組和第二組），平臺推薦算法在較短時間內快速提高了兩個組別政治類信息的推送比例，但隨著時間的推進，上述兩組該類別信息占比并沒有繼續上升或持續穩定在高位，而是出現波動和下降趨勢。其次，觀察從第三組~第十二組的變動趨勢可發現，盡管上述各組無政治類別信息點擊偏好，但可以看到各組的推送信息流中始終會包括一定比例的政治類主題信息；此外，上述各組在研究實施的前半段變動趨勢差異較大，而研究實施的后半段變動趨勢差異變小。最后，外部信息內容變化同樣對個體信息獲得有重要的影響。例如，從研究實施的第18天開始，各組推送政治類信息的比例均開始下降，并均在第20天下降到較低的位置。筆者查詢第三方平臺熱度指數發現，在研究實施的第18天某流量明星的負面輿情開始發酵并在第20天達到峰值。由此可見算法設計原理中的內容熱度對各組別信息獲取存在直接的影響，算法在特定時間會按“流行度”“熱度”等指標推送信息流，而相對忽略個體點擊偏好和預測的類別。

（三）基于熵指數的各組別推送信息類別分析

本節進一步借用熵指數對各組別推送信息流中信息類別的多樣性程度進行分析。筆者以日為單位計算了每個推送信息流的熵指數，值越高代表該推送信息流中的信息類別多樣化程度越高。得到每個推送信息流的熵指數后，使用兩層次固定效應模型考察各組別不同日期推送信息主題多樣化程度的差異。

表3模型一報告了控制變量、組別變量以及日期變量對推送信息流熵指數的影響。從組別差異來看，第一組、第二組以及第三組被推送信息的類別多樣化程度相對較低，而第十一組、第七組、第八組以及第十二組被推送信息的類別多樣化程度則相對較高。結合上文各組別點擊偏好設置可以看出，偏好多個信息標簽的組別（如第二組）被推送信息的多樣化程度不一定高，反而偏好特定某類標簽的第十一組和第十二組。由于偏好的標簽均屬于小概率信息類別（偏好信息類別在基準時期占比分別為0.8%和0.6%），點擊偏好提升了這些信息類別的概率，因此熵指數更高。從日期變量來看，隨著研究的推進，各組推送信息流主題的多樣化程度有增加的趨勢。

表3模型二主效應和模型二交互效應（組別與推送日期的交互項）則顯示，模型二組別變量（主效應）與模型一組別變量的差異情況高度一致（但系數差異更大），如系數均是第二組最低、第十一組最高，表明模型一中不同組別被推送信息多樣化程度的差異主要出現在算法與各組別互動的初期，隨著時間的推移，時間作為調節變量明顯減少了各組別間信息多樣化程度的差異。

綜上，基于信息主題維度的分析結果顯示，平臺算法會因個體點擊偏好而增加特定信息的推送量，但各組均未出現因迎合個體點擊偏好而過度推送特定類別信息的情況，平臺始終會給各組推送一定比例的非該組點擊偏好的主題信息，且隨著算法與個體點擊行為交互的深入，各組別間主題信息多樣化程度的差異也在降低。這表明從信息推送主題來看，算法可能導致的過濾氣泡的威脅被夸大了，算法增加了個體偶遇多樣化主題信息的可能性。

五、基于信息語義異質性的實證分析結果

（一）個體賬號及所屬組別在語義向量空間中的差異

本節從更深層次的信息語義維度分析推送信息異質性。筆者使用Doc2vec模型對平臺推送的信息（標題和摘要）進行訓練，以個體賬號加日期為單位，得到各個體賬號每天的200維實數向量表示。在圖3中，筆者計算了各個體賬號200維實數向量均值，進而使用PCA降維方法將各個體賬號的向量表示投影到有實質意義的二維空間中（圖3使用個體賬號所屬的組別來標記每個數據點）。簡單來說，通過PCA降維后的主成分一能夠發現個體賬號向量表示間的最大化方差，即可以捕捉不同個體賬號間推送信息在語義上的主要差異（Rheault & Cochrane，2018）。本研究在此部分主要關注同一個組別內部不同賬號以及不同組別賬號在主成分一上的差異情況。

從同一個組別內部不同賬號在X軸的分布可見，各個賬號的分布并非是混亂無序的。同一個組別的個體賬號在X軸上的分布更為接近，也即同一個組別內賬號的推送信息在語義上相對更為接近。從組別間的差異來看，不同組別的推送信息在語義上存在較為明顯的差異和分化，其中第一組和第二組位于X軸靠右的位置，第七組和第九組位于X軸靠左的位置。

為更直觀地呈現不同組別間推送信息內容的差異，本文進一步對各個體賬號的值按照組別加總求均值，結果如圖4所示。由圖4可見，在主成分一捕捉的推送信息語義差異上，第二組位于最右側，第十一組位于最左側，兩組之間語義差異最大。另外，以X軸的0值為分界，除去隨機測試組（第一組）以及極端測試組（第十組、第十一組和第十二組）外，其余各組在X軸上明顯分為兩大類，其中第二組、第四組、第六組以及第八組在X軸上為正，而第三組、第五組、第七組、第九組為負。綜合圖3和圖4的結果可以看出，各個虛擬賬號在語義向量空間中的分布并非是混亂無序或聚在一團的，同一組別內部各個賬號推送信息的內容更為接近，各個組別間內容則出現分化。

（二）不同組別在各子語義向量空間中的差異

需要說明的是，上一小節觀察到各組別間推送信息語義的差異和分化可能是由于各賬號間推送信息的主題差異導致的，為此，本部分將深入到各個信息主題子空間，進一步觀察各個組別間的語義差異。具體而言，首先挑選“政治”“社會”“娛樂”“世界”“歷史”“金融”等六個主題的推送信息（標題加摘要），使用Doc2vec模型分別對這六個子數據進行訓練，得到各個體賬號每天在上述六個子數據中的200維實數向量表示，進而參照上節步驟分別對上述向量表示進行PCA降維并按照組別進行加總求平均，圖5展現了不同組別在上述六個子信息空間的分布情況。

由圖5可見，當我們將研究范圍聚焦至具體的信息子空間時，各組別在不同子空間中同樣存在著明顯的語義差異。有趣的是，各組別在不同子空間中的語義差異存在驚人的一致。除隨機測試組以及極端測試組外，其余各組與上一節一致，在不同子空間的X軸上同樣出現明顯的分化。其中第二組在各個子空間中均位于X軸的最右側，第七組和第九組在各個子空間中則位于X軸的最左側，各組別間在不同子空間中出現了規律且一致的分化。以“社會”主題為例，第三組和第五組均有社會新聞的點擊偏好，可以看到上述兩個組別在社會子空間X軸上的分布非常接近；同時，其他各組并非是聚成一團或與第三組和第五組距離過遠，而是呈現與上一節總體向量空間以及其他子信息空間類似的分布規律。如第一組、第二組、第七組和第九組均無社會新聞點擊偏好，但他們被推送的社會新聞在語義上出現了明顯的分化。

各子語義向量空間分布情況再次表明，在信息語義維度，算法強化了過濾氣泡效應，不同組別的推送信息在語義向量空間中會出現較為明顯的差異和分化。盡管從信息主題維度來看，平臺會持續推送部分用戶完全不會點擊的信息類別，這提升了個體偶遇多樣化信息的可能性，進而降低了各組別間推送信息在主題維度的異質性。但從信息語義維度來看，算法根據用戶點擊偏好來捕捉、估計深層次的語義并進行推送，用戶被推送的信息在語義維度出現明顯的分化，且這種分化在各子空間高度一致。即在更深層的信息語義維度，信息推送出現窄化和固化，不同用戶組別像是被算法框定在語義光譜中一個個相對固定的位置，只能看到特定內容的“政治”“社會”“娛樂”“世界”“歷史”“金融”信息。

（三）基于兩層次固定效應模型的進一步分析

在上文以個體賬號加日期為單位訓練文檔向量的基礎上，本節以具體每條推送信息為單位訓練文檔向量，在不同單位訓練文檔向量以檢驗上文結果的穩健性的同時，進一步考察各組別推送信息語義維度分化的動態變化。筆者首先以每條推送信息為單位，使用Doc2vec模型對平臺推送的所有信息進行訓練，得到每條推送信息的200維實數向量表示，進而通過PCA降維方法計算每條推送信息向量表示的主成分一的值，進而使用兩層次固定效應模型考察各組別不同日期推送信息內容在主成分一上的差異與變化。

表4模型一報告了控制變量、組別變量與日期變量對推送信息語義的影響。從組別的差異看，以第八組為參照項，可以看到，第二組和第四組在主成分一上明顯高于第八組，第六組則低于第八組，但系數較小。與此對應，第三組、第五組、第七組和第九組在上文中與上述各組內容層面分化明顯且位于X軸左側的組別在模型結果中均明顯低于第八組在主成分一上的值。以具體每條推送信息為單位訓練文檔向量的結果再次驗證了上文結果，各組別間出現了明顯的語義維度的分化且模式相對穩定。

模型二則進一步加入了組別與推送日期的交互項，從模型二主效應來看，在研究初期，各組別間在主成分一上有差異，但并未呈現上文中各組間穩定的分化模式。而模型二交互效應結果則顯示，隨著算法與個體點擊行為互動的深入，各組間開始呈現上文中（包括模型一）所展示的分化模式。具體而言，相較于第八組，第二組、第四組和第六組在主成分一上的值在增加，第五組、第七組和第九組在主成分一上的值則在降低（第三組在研究初期就明顯低于第八組），逐漸形成了在語義空間中更為穩定的分化（第二組、第四組、第六組和第八組在主成分一上取值較高，第三組、第五組、第七組和第九組在主成分一上取值較低）。該結果的重要性在于，它表明，從信息語義維度來看，算法并非從一開始就將不同用戶組框定在一個固定的位置，而是隨著算法與個體點擊行為互動的不斷深入，不同組別在語義光譜中不斷移動，逐步出現上文中明顯且穩定的分化。

六、穩健性檢驗

為檢驗信息語義異質性部分的穩健性，筆者提取前述文檔向量模型訓練的高維向量的前50個主要維度，基于余弦相似度來測量各組間以及各組內部的語義相似度。圖6結果顯示，各組間出現了與前文結果一致的明顯的語義分化。同時筆者計算了各組組內平均語義相似度并賦值給節點權重。由圖6可見，各組組內平均語義相似度均較高，組內語義差異明顯小于組間差異。

本文圖3、圖4和圖5結果是以個體賬號加日期為單位訓練文檔向量進行計算得出的，為驗證上述模型結果的穩健性，本研究同時直接以每條推送信息為單位訓練文檔向量，結果與上文無明顯差異。

七、結論與討論

我們已經生活在一個充斥著算法的社會中，算法深度介入給社會科學研究帶來諸多挑戰。針對算法黑箱化、復雜性和難追蹤等難題，本研究嘗試在研究設計和數據生產環節有所創新（Wagner et al.，2021），通過設置若干不同點擊偏好的個體賬號與平臺進行較長時間的互動，收集不同賬號在該平臺的推送信息大數據，進而對算法推送信息在主題以及語義兩個維度的異質性進行實證分析。

不同組別在信息主題與信息語義兩個維度的差異和分化表明，數字時代算法作為社會權力已變得更為隱晦（拉什，2009），算法規制呈現高度復雜化、精細化和隱蔽化等特征。社會層面平臺盈利、外部監管、社會輿論等不同甚至是有沖突的需求，以及技術層面算法捕捉深層語義能力的進步，使平臺推送的信息呈現主題多樣化而深層語義窄化的情況。一方面，平臺使用基于內容熱度的推薦邏輯，在主題維度上增加了個體偶遇更多樣化信息主題的機會，這有利于減少有關算法強化過濾氣泡、導致個體信息獲取窄化以及個體間信息隔離的爭議，也符合外部監管和社會輿論的要求方向。但另一方面，從實證結果可以看到，在更深層、更為隱蔽的信息語義維度，高熱度的信息被平臺進行了隱蔽的精細化處理，平臺通過捕捉和估計用戶偏好的語義，試圖滿足和強化不同個體的語義偏好（盡管這一語義偏好是平臺預測的）。隨著個體與平臺的互動，不同個體逐漸被固定在語義光譜中的特定位置，只被推送特定語義維度的信息，這導致了更為隱蔽的個體信息獲取窄化以及個體間的信息隔離。這一發現意味著：首先，在研究中需要重視信息的不同維度，已有文獻中看似矛盾的實證分析結果可以通過在研究中細化和統一分析維度來解決。其次，隨著平臺與深度學習等新技術的不斷融合，平臺的運行邏輯由傳統意義上的分類邏輯（粗粒度、靜態的信息類別）向距離邏輯（細粒度、實時變動性的信息距離）轉變，平臺對信息流的控制在這一過程中變得更加復雜化、精細化和隱蔽化。比較不同用戶在傳統的信息主題與更深層次的信息語義等兩個維度上信息獲取的差異，有助于揭示數字時代算法規制如何通過更精細、隱蔽的信息流控制來行使社會權力，進而有助于理解算法帶來的潛在社會后果。

上述算法權力運作方式的特征導致我們既難以通過公開的算法原理和代碼，也難以通過單個用戶的訪談或平臺推薦數據來識別和分析算法權力。面對上述難題，本研究嘗試借鑒社會科學算法審計（Brown et al.，2021）和計算機科學計算實驗（Wang，2007）的研究思路，將虛擬賬號作為研究工具，通過設置不同點擊偏好的虛擬賬號與算法，與真實數據世界進行長時間自動互動，進而嘗試挖掘算法與社會更長時間跨度的互動過程及其潛在影響。上述研究方法為社會科學提供了探索黑箱化技術世界的可能接口與路徑，有助于我們真正進入算法的政治化空間去評估算法在決策中的具體角色以及可能的社會影響，從而為數字時代實證研究算法影響提供了數據收集以及研究方法上的新選擇。

作為一項社會科學實證分析算法的探索性研究，本文還存在需要繼續深入之處。第一，未來基于更多參數、更細致的信息主題類別乃至差異化的數字平臺來進一步進行研究有助于我們更為深入地了解算法與個體的互動過程。特別是因為平臺可獲取的數據有限，在本研究設計用戶點擊偏好時僅依據信息主題這一大的類別而未能將更細致的點擊偏好考慮在內，未來研究設計中若能考慮更細致的點擊偏好將有助于推進對本文研究問題的理解。第二，本文研究設計中未包括“點贊”（like）、“不感興趣”（dislike）等改變平臺內容的行為，將來在時機成熟時可在研究設計中加入上述內容，以觀察平臺推送信息的變化情況。第三，在推送信息內容分析部分，本文使用文檔向量模型分析各組別在總體信息內容空間以及各子信息內容空間的相對位置，尚未回答各空間中的主成分一的差異究竟是何種層次的語義差異，這種復雜的文檔向量模型的可解釋性有待進一步研究。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.