![]()
AI 可能會讓科學研究變得越發高效,但同時也可能讓科學探索變得愈發保守。
作者丨鄭佳美
編輯丨岑峰
![]()
在當代科學研究中,人工智能正在改變的不只是研究效率,而是科研活動本身的結構。
隨著 AI 工具在自然科學中的廣泛應用,越來越多的研究可以在更短時間內完成,論文產出和引用回報也隨之提高。在以發表數量、影響力和速度為核心指標的學術體系中,這種效率優勢正在直接影響研究者的行為選擇和研究方向布局。
然而,效率的提升并不必然意味著科學探索的拓展。當 AI 更擅長處理數據充足、問題明確、路徑成熟的研究任務時,科研活動是否會整體性地向這些方向集中,從而改變科學知識的分布結構和演化方式,這是一個長期存在但缺乏系統證據的問題。個體層面的成功是否真的能夠累積為集體層面的進步,在 AI 深度介入科研之后,反而變得更加值得重新審視。
在這一問題背景下,清華大學 FIB 實驗室牽頭開展了一項大規模實證研究,論文題為《Artificial Intelligence Tools Expand Scientists’ Impact but Contract Science’s Focus》并已被Nature正刊收錄。
研究基于覆蓋 1980–2025 年、超過四千萬篇自然科學論文和五百多萬名研究人員的長期數據,從個人科研回報與科學整體結構兩個層面,系統分析了人工智能工具在自然科學中的擴散過程及其深層影響。
研究提出的核心發現具有明確的張力:人工智能顯著放大了個體科學家的學術影響力,但與此同時,科學整體的研究范圍和互動結構卻可能正在收縮。
![]()
論文地址:https://www.nature.com/articles/s41586-025-09922-y
對于當下火熱的 AI for Science (AI4S) 領域,這篇文章不僅是現狀的描述,更是一份深刻的提醒:真正的科學突破往往發生在“數據貧瘠”或“非共識”的荒原。如果 AI4S 僅僅淪為“在已有大數據的領域刷榜”的工具,它將導致科學探索的內卷化。
01
AI 帶來的并非只有增長,還有重構
這篇論文的實驗結果通過一系列量化分析,系統地揭示了人工智能在自然科學研究中的真實影響。
研究首先證明,人工智能在自然科學中的采用已經成為一種規模巨大且不斷加速的趨勢。作者在 1980–2025 年的自然科學論文中共識別出 310,957 篇 AI-augmented papers,占全部樣本的約 0.75%,而研究覆蓋的總規模達到 41,298,433 篇論文和 5,377,346 名研究者。
進一步的時間序列分析顯示,在傳統機器學習、深度學習和生成式 AI 三個階段中,論文和研究者采用 AI 的速度均持續加快。具體來看,1980 到 2025 年間,AI 論文占比在不同學科中上升了數十倍,例如地質學上升 10.70 倍,生物學上升 51.89 倍。
與此同時,采用 AI 的研究者占比增長得更快,在地質學中達到 135.46 倍,在物理學中高達 362.16 倍。這些結果首先表明,AI 在自然科學中的擴散是一種系統性變化,而非個別領域的偶發現象。
![]()
在個體科學家層面,實驗結果顯示 AI 的采用與科研回報之間存在顯著關聯。論文給出的核心結論是,使用 AI 的科學家,其論文發表數量平均是未使用者的 3.02 倍,獲得的引用數量平均是未使用者的 4.84 倍,并且在職業發展上更早成為研究負責人,時間平均提前約 1.37 年。
這些結論基于大規模樣本分析得出。在包含 5,377,346 名研究者的數據中,六個自然科學學科里采用 AI 的研究者,其年均發表量均顯著高于未采用者,且統計檢驗結果達到 P < 0.001。同時,在 27,405,011 篇引用記錄完整的論文樣本中,AI 論文在發表后的多年里,其年均引用數比非 AI 論文高出 98.70%。這些數據共同說明,AI 在個體層面顯著放大了科學家的科研產出和學術影響力。
![]()
然而,當研究視角從個人擴展到整體科學生態時,實驗結果呈現出相反的趨勢。研究人員通過將論文嵌入到 768 維的科學語義空間中,并測量論文集合覆蓋范圍,發現 AI 研究在整體上的知識廣度明顯小于非 AI 研究,在六個學科中位數平均收縮 4.63%,且在細分到 200 多個子領域后,這種收縮仍然在 70% 以上的子領域中存在。
![]()
同時,AI 研究的知識分布更加集中,研究注意力更容易聚焦在少數核心問題上。在學術互動方面,引用同一篇論文的后續研究之間,彼此互動的程度平均減少 22%,表明 AI 研究更容易圍繞少數核心成果展開,而不是形成相互連接的新研究網絡。
引用分布分析進一步顯示,AI 研究中前 22.20% 的論文獲得了 80% 的引用,前 54.14% 的論文獲得了 95% 的引用,其引用不平等程度以 Gini 系數量化后為 0.754,明顯高于非 AI 研究的 0.690。綜合這些結果,論文用數據清楚地表明,AI 在顯著提升個體科研回報的同時,也使科學研究在整體層面變得更加集中,學術互動減少,探索空間隨之收縮。
![]()
02
從大規模文獻數據中,構建研究樣本
這項研究的實驗設計可以理解為一條從識別、對照到結構測量的完整分析流程。
研究團隊首先以 OpenAlex 數據庫中的自然科學論文和研究人員網絡作為總體樣本,主分析規模為 41,298,433 篇論文和 5,377,346 名研究人員,時間跨度覆蓋 1980–2025 年,并按照機器學習、深度學習和生成式 AI 三個階段進行劃分。
研究團隊刻意將分析重點放在自然科學中把 AI 作為研究工具的成果,而不是計算機科學或數學中開發 AI 方法本身的研究,從而確保研究對象是 AI 對科學生產方式的外溢影響,而非 AI 學科內部的技術演化。
在區分 AI 與非 AI 研究時,研究團隊沒有采用關鍵詞匹配的方法,而是對預訓練的 BERT 語言模型進行兩階段微調,分別在論文標題和摘要上訓練模型,并將兩者集成為統一的識別器,以減少人為選擇觸發詞所帶來的偏差。
為驗證這種識別方式的可靠性,研究人員組織具備相關背景的專家對隨機抽樣論文進行盲審標注,結果顯示專家之間的一致性 Fleiss’ κ 達到 0.964,而模型在以專家標注為真值的評估中 F1 值達到 0.875。這一步為后續所有分析提供了關鍵前提,即 AI 與非 AI 研究成果的劃分具有足夠的準確性和穩定性。
![]()
在個人層面的分析中,研究團隊主要使用研究人員的年度論文發表數量和年度引用數量來衡量科研產出與學術影響力,并結合職業階段變化來刻畫研究人員從 junior 階段轉變為 established 或 leader 的過程。基于這些指標,研究人員得出了使用 AI 的科學家發文數量增加 3.02 倍、引用數量增加 4.84 倍,并且更早成為研究負責人的結論,這些結果在不同學科中表現出一致的顯著性。
![]()
在集體層面的分析中,研究團隊通過兩類指標來量化科學結構的變化。第一類是知識廣度,研究人員使用 SPECTER 2.0 將研究成果映射到 768 維語義空間中,并將一組抽樣成果在該空間中所覆蓋的最大距離定義為知識廣度,用以比較 AI 與非 AI 研究在主題覆蓋范圍上的差異。
![]()
第二類是后續互動,研究人員將引用同一項原始研究的后續成果視為一個整體,統計這些成果之間的相互引用密度,結果發現 AI 研究的后續互動減少約 22%。研究團隊據此指出,AI 研究更容易圍繞少數熱門核心成果形成放射式結構,而不是像新興研究領域那樣形成相互連接、不斷擴展的研究網絡。
![]()
03
被效率機制擠出的探索空間
這項研究的意義不在于簡單地得出人工智能好或不好的結論,而在于研究團隊用系統的數據指出了一個更深層的問題:人工智能在明顯提升個人科研收益的同時,可能正在改變科學整體前進的方式,而且這種改變未必是理想的。
研究人員發現,使用 AI 的科學家在個人層面獲得了非常明確的好處,包括論文發表數量增加 3.02 倍、引用數量增加 4.84 倍,以及平均提前 1.37 年成為研究負責人。但與此同時,在整體層面,科學研究覆蓋的知識范圍卻收縮了 4.63%,研究之間的互動也減少了 22%。這些數據共同表明,個人影響力的擴大,正在伴隨著集體探索范圍的縮小。
進一步來看,研究團隊并不認為這種現象是因為研究人員變得不努力或缺乏創造力,而是指出了一種更現實的機制。當人工智能更容易在數據充足的研究方向上帶來更高效率和更好表現時,研究人員在理性選擇下,自然會把更多時間和資源投入這些方向。
結果是,科學研究不斷在數據豐富的領域中被加速、優化和重復,而那些數據稀缺、但可能更基礎、更具開創性的研究問題,則更容易被邊緣化。研究人員還發現,一些直覺上可能重要的因素,例如研究主題本身是否熱門、早期影響力大小或是否獲得優先資助,與這種集中趨勢的關系并不明顯,相比之下,數據是否容易獲得更可能是推動 AI 集中使用的關鍵原因。
基于這些發現,研究團隊對科研政策和 AI for Science 的發展方向提出了提醒。如果學術評價體系和資源分配機制繼續主要獎勵更快產出和更高引用,那么人工智能帶來的個人激勵會被進一步放大,而科學整體層面的研究集中、互動減少和探索范圍變窄,也可能隨之加劇。
換句話說,人工智能可能會讓科學研究變得越來越高效,但同時也可能讓科學探索變得越來越保守,這正是研究團隊希望通過這項研究引起關注的核心問題。
04
項目背后的科研力量
這篇論文的一作是郝千越,他目前是清華大學電子工程系的博士研究生,研究方向主要集中在人工智能領域,包括強化學習和大語言模型等方向。
本科階段,郝千越同樣就讀于清華大學電子工程系,在博士階段持續從事人工智能方法及其應用相關的研究工作。在科研成果方面,他在 NeurIPS、KDD 等國際頂級人工智能會議和期刊上發表過多篇論文,其中多項工作獲得 Spotlight 等認可。
![]()
參考資料:https://haohaoqian.github.io/
這篇論文的通訊作者之一是徐豐力。徐豐力現任清華大學電子工程系助理教授、博士生導師,于 2023 年入職清華大學,在該系開展人工智能、數據科學、社會計算與復雜網絡等方向的研究工作。他早期在清華大學獲得工學博士學位,隨后曾在香港科技大學和芝加哥大學從事博士后研究。
在研究方向上,徐豐力教授主要關注基于數據驅動和人工智能的方法來建模復雜信息系統和人類行為模式,尤其聚焦大語言模型、社會行為計算、城市科學等交叉領域。
目前,他已在 Nature Communications、Nature Human Behaviour、PNAS 等頂級綜合性學術期刊,以及 NeurIPS、KDD、WWW 等國際會議上發表多篇高水平論文,并獲得吳文俊人工智能優秀青年獎、CAAI 社會計算新星學者獎、微軟學者獎研金等多項學術榮譽。
![]()
參考資料:https://fenglixu.github.io/
這篇論文的另外兩位通訊作者分別是清華大學的李勇教授和芝加哥大學的 James Evans 教授。
其中,李勇是清華大學電子工程系的長聘教授、博士生導師,并擔任城市科學與計算研究中心負責人,是教育部長江學者。他長期從事人工智能、數據科學、復雜系統與社會計算等交叉學科研究,主持了多個國家重點研發計劃和國家自然科學基金重點項目。
在科研成果方面,李勇教授在人工智能和數據科學方向積累了豐富研究成果,在 Nature Computational Science、Nature Machine Intelligence、Nature Human Behaviour、Nature Cities 等綜合性期刊,以及 ACM KDD、NeurIPS、ICLR、WWW 等國際會議上發表了大量高水平論文,累計引用超過三萬多次,并擁有多項授權專利。
他曾入選全球高被引科學家、國家萬人計劃青年拔尖人才,獲得教育部科技進步一等獎、IEEE ComSoc 亞太杰出青年學者獎、吳文俊人工智能優秀青年獎等多項榮譽,同時也擔任多個國際會議籌委會成員和國際期刊編委。
![]()
參考資料:https://fi.ee.tsinghua.edu.cn/~liyong/
James Evans是芝加哥大學社會學系的 Max Palevsky 教授,同時擔任該校 Knowledge Lab 的主任和計算社會科學項目的學術負責人,并在 Santa Fe Institute 等機構任客座或外部教授。他的研究重點是理解知識與集體思維系統的形成與演化機制,包括注意力分布、思想起源、共享思維模式、協同與爭議過程,以及確定性與不確定性如何在群體中積累。
在研究方法上,James Evans 常使用大規模數據、機器學習和生成模型等工具來探討人類理解與創新的集體機制。他的研究成果發表在 Nature、Science、PNAS 等頂級學術期刊,并經常受到 The New York Times、The Economist、BBC、CNN 等國際媒體的關注與報道。此外,James Evans 還長期在學術界從事編輯、評論和項目指導等工作。
![]()
參考資料:https://sociology.uchicago.edu/directory/james-evans
值得一提的是,研究團隊并未止步于對問題的識別和診斷,而是嘗試在實踐層面回應這一結構性挑戰。圍繞人工智能在科研中可能加劇研究集中、壓縮探索空間的風險,徐豐力、李勇教授團隊進一步提出了一種面向未來科研范式的解決思路,推出了一個強調全流程協同與跨學科探索的科研智能體系統OmniScientist(訪問網址:OmniScientist.ai)。
![]()
訪問地址:OmniScientist.ai
與將 AI 僅作為單點工具嵌入科研流程不同,OmniScientist 試圖將人工智能引入科研問題定義、文獻理解、假設生成、方法設計和結果分析等多個關鍵環節,通過多智能體協作的方式,幫助研究者系統性地拓展研究視角,降低跨領域探索的門檻,從而緩解單一數據密集方向對科研路徑的過度吸引。
某種意義上,OmniScientist 正是對論文所揭示問題的直接回應,即在承認 AI 顯著提升科研效率的同時,嘗試通過更具結構意識的設計,引導人工智能服務于更廣泛、更具探索性的科學研究目標。
未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!
公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.