![]()
導讀
近年來,大量低質論文如潮水般涌向學術界,不斷侵蝕并挑戰科學研究的公信力。
助長該不良風氣的是公共數據集與人工智能、論文工廠的“聯袂攜手”,讓學術出版業面臨更為嚴峻的造假危機。
英國薩里大學一名學者表示,“我每天都能收到許多幾乎一模一樣的論文,有時甚至一天兩篇”,“劣質量研究的‘產業化’讓大量無用研究充斥文獻,實在令人憤怒。”
林 巖 | 編譯
01
學界之“哀”,大量相似論文充斥文獻
2024年,英國薩里大學統計學家、《科學報告》副主編Matt Spick在工作中覺察到詭異現象,大量看似出自同一模板的論文涌入期刊進入同行評審。
他還發現這些論文大多基于美國同一個公開數據集——全國健康與營養檢查調查(NHANES)。該數據集通過健康檢查、血液檢測和訪談等方式,收集了超過 13 萬人的飲食信息及其他健康相關測量數據。
Spick無奈地表示:“我每天都能收到許多幾乎一模一樣的論文,有時甚至一天兩篇。”
![]()
Spick很快意識到,這并非個例,而是只是問題的冰山一角。他與同事在《公共科學圖書館·生物學》雜志上發表報告指出,近年來利用 NHANES 數據集的劣質論文數量急劇增加。
其他研究人員也發現,在基因研究、文獻計量學分析以及不同科學學科中的性別差異研究等多個領域,都存在類似現象。
02
千篇一律的“套路”
這些 NHANES 論文均遵循著相似的模式:首先選定一種健康狀況,再確定一個可能與之相關的環境或生理因素,最后指定一個人群群體。例如研究 65 歲以上男性維生素 D 水平與抑郁癥的關聯,或分析 18 至 45 歲女性牙齒健康狀況與糖尿病的關系。
Spick感慨道:“感覺就像有人把所有可能的組合都研究了個遍。”
![]()
為了深入了解這類研究的泛濫程度,Spick及其團隊在 PubMed 和 Scopus 兩大科學論文數據集中展開搜索,尋找使用 NHANES 數據研究單一關聯的論文。
結果顯示,共有 341 篇此類論文發表在 147 種期刊上,包括《科學報告》《BMC 公共衛生》和《英國醫學雜志·開放版》等。2014 年至 2021 年期間,平均每年僅發表 4 篇此類論文。
然而自 2022 年起,數量急劇攀升,截至 2024 年 10 月研究團隊搜索時,當年已發表 190 篇。這一增長速度遠遠超過了使用大型數據集進行健康研究的總體增長速度,暗示 NHANES 研究數量激增背后存在其他因素。
03
人工智能與論文工廠或是“幕后推手”
Spick認為這背后極有可能是以營利為目的的論文工廠在作祟,同時 AI也起到了推波助瀾的作用,不斷生成文本為論文造假提供了便利。
悉尼大學分子生物學家、此次《公共科學圖書館·生物學》論文的同行評審員Jennifer Byrne認為,人工智能可能被用于不斷改寫相同的 NHANES 研究結果,以逃避抄襲檢測。
Byrne也表示,“論文數量的激增速度和規模,讓人不得不懷疑背后存在某種協調機制”。
![]()
許多近期發表的 NHANES 研究在數據分析上存在明顯問題,作者往往在沒有明確理由的情況下,對數據集進行選擇性分析。例如僅對特定年份或特定年齡段的人群進行分析。
Spick認為,這表明作者旨在尋找具有統計學顯著性的結果,以便輕松發表論文。然而,在如此龐大的數據集中“碰運氣”,必然會產生大量假陽性結果。研究團隊對 28 項探討抑郁癥的 NHANES 研究進行深入分析后發現,僅有 13 項研究的結果在經過統計調整后依然成立。
![]()
Spick及其團隊認為,他們的分析可能大大低估了問題的嚴重性。他們的搜索僅針對符合特定模式的 NHANES 研究,而更廣泛的搜索顯示,使用該數據集的論文數量從2023 年的 4926 篇增加到 2024 年的 7876 篇。Spick還指出,其他大型健康數據集,如全球疾病負擔研究,也可能面臨類似風險。“劣質量研究的‘產業化’讓大量無用研究充斥文獻,實在令人憤怒。”
Richardson指出:“文章中提到的所有出版商都收取了費用,每篇論文的收費可能高達 1000 美元左右,以發表這些劣質量內容。” 此外,研究人員為了職業發展,往往更傾向于發表更多論文,而非追求更高質量的論文。Richardson警告說:“除非我們從根本上改變科學出版的激勵機制,否則這一問題只會愈發嚴重。”
參考資料
Low-quality papers are surging by exploiting public data sets and AI
https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai
青科沙龍第154期:解讀鄒偉平、王少萌最新Nature研究;關鍵詞:STAT3、PROTAC、癌癥免疫
Deep Science預印本
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.