![]()
導語
從微博大V到B站百大UP主,為什么某些用戶的一條動態能瞬間引爆全網,而其他人的聲音卻如石沉大海?這背后隱藏著社交網絡研究中的核心命題——影響力最大化(Influence Maximization, IM)。它致力于尋找網絡中那些能夠引發最大規模信息擴散的關鍵“種子”節點。作為連接社交網絡分析與算法優化的橋梁,IM研究在過去18年間經歷了怎樣的演變?哪些國家和學者在引領這一領域?未來的風口又是由于深度學習還是強化學習主導?本文基于2006年至2024年間的海量文獻數據,通過系統的文獻計量學分析,全景式揭示該領域的演進路徑、核心力量分布及未來前沿趨勢。
關鍵詞:影響力最大化、社交網絡、文獻計量學、信息擴散、病毒式營銷
楊明哲丨作者
趙思怡丨審校
![]()
論文題目:The Influence Maximization in Complex Networks: Significant Trends, Leading Contributors, and Prospective Directions 論文鏈接:https://onlinelibrary.wiley.com/doi/pdf/10.1155/cplx/7605463 發表時間:2025年11月15日 論文來源:Complexity
當今社交媒體和各種網絡技術的普及改變了人們的生活方式以及彼此之間的溝通模式。人們在不同的網絡平臺上在線分享新聞動態或信息、發布活動通知,或是針對共同利益發表觀點。由于在網絡中的活動或連接程度不同,并非所有用戶都具有同等的重要性或影響力。某些用戶基于其社交互動或朋友圈,可能擁有更高水平的參與度和影響力,比如知乎微博大V,B站百大up主等等。
這便涉及影響力最大化(Infuence maximization,IM)的問題。影響力最大化指在網絡中確定一組能夠有效且廣泛地影響用戶的個體。這項任務被公認為非常復雜,因為它需要一種衡量標準來量化影響力。鑒于通過社交網絡實現的影響力最大化在當今具有重大意義,盡管已經有多種解決影響力最大化問題的嘗試,但在旨在探尋“誰”或“哪些人”可能是信息的敏感接收者,以及誰在影響這些接收者的研究領域中,仍存在顯著且顯而易見的空白和切入點,這些問題持續受到學者的重視 。
構建社交網絡表示最常用的方法之一依賴于圖結構,其中節點代表用戶,邊反映他們的交互。在此之后,用戶的影響力可以通過多種與網絡拓撲結構相關的方式進行量化。這被稱為“行為無關”(behavior-agnostic)的研究 。行為無關方法的主要問題之一是,它們缺乏基于行為模式識別目標個體的針對性,只是采用基于圖的結構化方法來定位目標用戶。其他研究也將用戶行為特征(如偏好或信任)納入考慮,并在網絡結構中尋找這些特征。這種可以被稱為“行為感知”(behavior-aware)的研究。
據作者所知,截至本研究,文獻中已有關于影響力最大化主題的描述性統計分析。補充性的文獻計量分析對學者非常有吸引力,因為它不僅能提供學科發展趨勢的概覽,還能幫助他們識別未來可能的研究方向。此外,初級研究人員可以借助文獻計量分析尋找切入點開始探索,而不會被海量的已發表論文所震懾。因此,本研究旨在通過回答以下問題,對影響力最大化進行文獻計量分析:
Q1:哪些期刊發表的影響力最大化研究文章份額最大?
Q2:哪些國家在影響力最大化研究方面產出最高?該領域引用率最高的研究和最具影響力的學者有哪些?
Q3:未來十年內,影響力最大化預期的研究方向和新興趨勢是什么?
文獻計量分析的方法
進行文獻計量分析有兩個基本且主要的來源:Scopus 和 Web of Science (WoS)。其中,Scopus 具有一些優勢,例如公眾可訪問性更好、內容覆蓋更全面、包含所有作者和機構的概況以及連續出版物來源。此外,多項研究已證實,Scopus 提供的覆蓋范圍比其他數據庫更廣泛,且收錄的獨有來源多于 WoS 。
下圖展示了該項影響力最大化文獻計量研究的數據收集與篩選流程 。
![]()
這份研究方案以社交網絡中的影響力最大化為核心主題,開展了一項跨越 2006 年至 2024 年的長周期文獻計量分析。研究旨在通過科學的方法論,系統地梳理該領域在過去 18 年間的演變路徑與發展趨勢。
在檢索策略與數據篩選方面,本研究嚴格限定了數據來源與技術參數。研究團隊于 2025 年 4 月 18 日從 Scopus 數據庫中,針對標題、摘要及關鍵詞字段,利用包含 "influence maximization"、"seed selection" 和 "viral marketing" 等核心詞匯的邏輯表達式進行了檢索。為了確保研究的高質量與學術嚴謹性,檢索范圍被精確鎖定為英語語種的同行評審期刊論文。
在樣本精煉過程中,研究執行了明確的納入與排除標準:僅保留主題聚焦于擴散模型、算法優化等核心領域的記錄,剔除了會議論文、書籍章節以及缺乏網絡擴散背景的非相關研究。數據流轉顯示,研究最初識別出 2,734 條原始記錄,在移除 1,288 條不符合要求的文獻后,最終篩選出1,446 篇高質量期刊論文。這組數據構成了后續文獻計量分析的最終數據集,為揭示該領域的動態發展提供了可靠的實證基礎。
數據分析結果
接下來,我們展示數據分析的結果。研究人員根據術語的聚類、邊和頻率對其進行了分析。本次研究涉及的論文共有 29,606 次引用,平均每年 1644 次引用,平均每篇論文被引用 20.47 次。如下表所示。
![]()
第二張表揭示了不同關鍵詞的數據情況。除 IM 外,最受歡迎的主關鍵詞包括“社交網絡(在線)”、“經濟和社會影響”、“近似算法”、“最大化問題”、“病毒式營銷”等。通常,高頻詞在特定學科中更受歡迎。這些關鍵詞被共同使用,以實現在社交網絡研究中的傳播最大化。
![]()
下圖展示了 2006 年至 2024 年間關于影響力最大化研究的年度發表量和引用趨勢,是衡量該領域學術活躍度和影響力的核心指標。
![]()
橙色柱子代表總發表量。從圖中可以看出,該研究領域的產出總體呈上升趨勢。在 2006 年至 2010 年的早期階段,研究產出非常有限(每年僅個位數)。發表量在2021 年達到了歷史最高點,該年發表論文數量為 165 篇。從 2022 年到 2024 年,論文發表數量出現了一定的回落。
紫色柱代表篇均引用量,即論文的平均學術影響力和質量密度。該指標在 2010 年 (150) 和 2014 年 (160) 出現了極其顯著的高峰。這表明在這兩個時間段內發表的研究(如 Chen 在 2009 年發表的關于高效 IM 算法的論文)具有極高的持久影響力,成為了該領域的奠基性或關鍵性文獻。
綠色柱表示總引用數,反映了某一年度發表的所有論文所獲得的總關注度。總引用量的分布與篇均引用量類似,在 2010 年至 2016 年期間保持在較高水平(約 80-130 次),隨后隨時間推移逐漸下降。圖中 2022 年至 2024 年的引用指標(紫色和綠色柱)顯著降低,這并非代表研究質量下降,而是因為新發表的論文需要一定的時間才能被后續研究引用,這是文獻計量學中的普遍規律。
2010 年和 2014 年被確定為該領域產出“高質量”研究的核心年份,這些年份的工作為后續的算法擴展和應用奠定了基礎。
全球科研格局:中美主導,亞洲崛起
接下來我們回答前文拋出的第一個問題:哪些期刊發表的影響力最大化研究文章份額最大。下面的表格詳細列出了在 IM 領域貢獻最多的前 11 個出版源(期刊及會議錄),并依據發表文獻數量(Documents)進行了排名。數據顯示,《計算機科學講義》(Lecture Notes in Computer Science)以 131 篇的出版量高居榜首,展現出該系列叢書在收錄此類研究上的極高活躍度;緊隨其后的是《信息科學》(Information Sciences)和《IEEE Access》,分別貢獻了 38 篇和 33 篇論文。此外,該表格還整合了總引用次數、篇均引用次數以及 2023 年的 CiteScore 和 SJR 評分等質量指標,揭示了不同出版物在影響力上的差異,例如《ACM SIGKDD 國際知識發現與數據挖掘大會論文集》雖然文章數量排名第五,但其篇均引用次數高達 177.07 次,位列所有來源之首。
![]()
接下來我們看哪些國家在影響力最大化研究方面產出最高。下表通過多個維度衡量了各國在該領域的科研產出與學術影響力。考慮的指標包括:
TP (Total Publications):總出版量,衡量產出數量。
TC (Total Citations):總被引次數,衡量整體影響力。
Average Citations per Publication:篇均被引次數,衡量研究的平均質量。
h-index & g-index:綜合衡量產出數量與高被引論文比例的指標。
![]()
在影響力最大化研究領域,中國與美國占據了絕對的主導地位:中國以495篇的出版量(TP)和39的h指數位居全球第一,展現出極高的學術活躍度與持續影響力;而美國則憑借8619次的最高總引頻次(TC)和87的g指數,在產出極具影響力的“頭部”論文方面表現卓越。與此同時,以新加坡和加拿大為代表的國家雖然出版規模較小(分別為38篇和22篇),但單篇平均被引次數分別高達84.23次和93.81次,分列全球前二,反映出其研究具有極高的學術價值與深度。此外,印度以112篇的產出位列出版量第三,而澳大利亞、日本、伊朗、韓國及中國香港的入榜,進一步印證了IM研究在亞洲的高度集中及其在復雜網絡分析領域的強勁實力。綜上所述,全球IM研究呈現出明顯的區域特征與戰略差異:亞洲地區(占據前十名中的七席)已成為產出核心,而北美則穩守質量高地,形成了中國側重于規模產出與持續影響、而美國及加新等國在研究深度與質量上更具優勢的驅動格局。
未來趨勢:智能化與復雜化
進一步的,我們關心研究機構和作者的情況。
下圖對比了全球最高產的兩大科研機構的研究關鍵詞,揭示了影響力最大化領域內機構間各具特色的研究側重:美國計算機科學系(a)的研究主題廣泛覆蓋了病毒式營銷、社區發現、社交網絡分析、種子選擇及信息傳播等多個核心維度;而印度計算機科學與工程系(b)的研究則表現出更強的應用導向,其研究內容較多涉及旅游場景下的信息擴散、信息維度及差異化評估等課題,這種對比鮮明地反映了頂級研究機構在IM理論探索與實際應用場景選擇上的多元化趨勢。
![]()
下面的表格和圖片列出了影響力最大化領域內最具學術影響力的 15 篇核心論文,以及作者共被引網絡圖。排在首位的是 Chen (2009) 的研究《Efficient Influence Maximization in Social Networks》,其被引次數高達 1900 次,該論文通過提出比傳統貪婪算法更高效的新算法,解決了復雜網絡中的傳播最大化問題。表中其他重要文獻如 Chen (2010b) 和 Goyal (2011c) 分別側重于大規模社交網絡的可擴展性研究及貪婪算法的優化,反映了該領域在過去十多年中從純理論探討向解決超大規模現實網絡效率問題的持續演進。
![]()
![]()
圖中的節點代表作者,節點大小反映了其被引用的頻次,而不同顏色則代表了五個主要的學術聚類:紅色聚類關注理論模型與算法效率,藍色聚類專注于大規模網絡的可擴展算法,紫色聚類則代表了人工智能與多智能體應用的融合方向。該可視化圖譜識別出了如 Chen W. 和 Tang J. 等處于核心地位的領軍學者,他們作為學術“橋梁”,將傳播建模、算法優化與社交網絡分析等多個跨學科研究支柱緊密連接在一起。
對于未來的研究趨勢,下圖則通過關鍵詞共現熱力圖,更微觀地刻畫了前 30 個核心研究熱點在各年度的演變頻率。圖中顏色的深淺代表了主題關聯度的強弱,不僅記錄了“影響力最大化”這一主課題自 2014 年起的爆發式增長,還識別出了近年來顯著崛起的新興子領域,如“深度強化學習”和“競爭性影響力最大化”,為理解該領域的科研興趣從傳統模型向智能化、復雜化場景的轉變提供了直觀依據。
![]()
總結
這項文獻計量分析闡明了社交網絡中影響力最大化研究的發展進程、現狀及前景。在以Wu Weili和Chen Wei為代表的學者及相關機構的重要貢獻下,本研究強調了中國和美國的主導地位。自2006年以來,相關出版物數量急劇增加,表明影響力最大化在危機管理、推薦系統和病毒式營銷中的重要性日益凸顯。
主要研究結果強調了開發“行為感知模型”以處理動態用戶交互的必要性,以及“可擴展算法”的重要性(如相關高被引研究所證明的那樣)。盡管已取得諸多進展,但仍存在研究空白,特別是在整合深度學習和人工智能以提升影響力最大化效能方面。研究強調,未來的工作應進一步探索混合算法及那些尚未得到充分關注的領域。本研究對影響力最大化科研圖譜的梳理,為專業領域的后續研究與創新奠定了基礎,最終將助力開發出更高效的信息傳播和社交網絡干預方法。
復雜網絡動力學讀書會
集智俱樂部聯合合肥工業大學物理系教授李明、同濟大學副教授張毅超、北京師范大學特聘副研究員史貴元與在讀博士生邱仲普、張章共同發起 。本次讀書會將探討:同步相變的臨界性、如何普適地刻畫多穩態與臨界點、如何識別并預測臨界轉變、如何通過局部干預來調控系統保持或回到期望穩態、爆炸逾滲臨界行為的關鍵特征、不同類型的級聯過程對逾滲相變的影響有何異同、高階相互作用的影響能否等效為若干簡單機制的疊加、如何有效地促進人類個體間的合作等問題。讀書會已完結,現在報名可加入社群并解鎖回放視頻權限。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.