注:本文整理自知名科學偵探Elisabeth Bik的博客文章,原文題目是“Discontinuous ridiculous stools – a preprint full of tortured phrases and stolen data”。
![]()
“Patients with provocative entrail illnessunclassified gave to crisis division a 3-day history of sickness, retching, migraine and irregular stomach torment alongside discontinuous ridiculous stools as of late.(患有未分類挑釁性內臟疾病的患者向危機部門陳述了為期3天的病癥:惡心、嘔吐、偏頭痛及不規則腹痛,近期伴有不連貫荒謬的便血)”
若您無法理解上面這句話,請不必擔心——大家都一樣。
![]()
扭曲短語
上面的文字充斥著“扭曲短語”(tortured phrases),這是作者試圖掩蓋抄襲行為常用的一種文本改寫方式。為逃過查重工具檢測,他們通過“同義詞替換軟件”來處理復制過來的內容,導致生成荒謬甚至可笑的短語。
常見的扭曲短語包括:
用“Counterfeit consciousness(偽意識)”替代“artificial intelligence(人工智能)”
用“Profound neural organization(深刻神經組織)”替代“deep neural network(深度神經網絡)”
用“Colossal information(巨型信息)”替代“big data(大數據)”
用“Bosom peril(胸部危險)”替代“breast cancer(乳腺癌)”
用“Haze figuring(霧測量)”替代“cloud computing(云計算)”
此類扭曲短語由Guillaume Cabanac、Cyril Labbé和Alexander Magazinov在2021年預印本《Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established journals》中首次提出[1]。
他們創建的“問題論文篩查數據庫”目前已收錄超過21,000篇包含五處以上此類短語的論文。大多數論文發表于2020年代初,2022年后頻率略有下降——可能因為ChatGPT等生成式人工智能工具能更有效地重寫并隱藏抄襲文本。
![]()
來自“問題論文篩查數據庫”的圖表,顯示每年包含至少5個扭曲短語的論文數量
鏈接:https://dbrech.irit.fr/pls/apex/f?p=9999:24::IR_years
![]()
一篇充滿詭異同義詞替換的預印本
在Google Scholar中檢索扭曲短語“provocative gut illnesses”(常用來替代“炎癥性腸病”,IBD),博客作者在medRxiv預印本庫中發現了一篇“寶藏文章”:Baqir Ali Khalid等人所著的《Significance of headache in inflammatory bowel diseases》[2],最初于2023年2月上傳至medRxiv。七名作者來自巴基斯坦的五所大學和醫學院。
![]()
鏈接:https://www.medrxiv.org/content/10.1101/2023.02.05.23285412v1
文章中,作者聲稱收集了20名IBD患者的“數據”,這些患者因頭痛和便血就診于急診科。
文本極度晦澀,存在大量過度同義替換的句子。試試理解以下表述:
Cerebral vein apoplexy can be deadly and finding is trying as side effects are vague(腦靜脈中風可能是致命的,并且由于癥狀模糊,診斷十分困難)
We might want to urge clinicians to continually reexamine their choices, particularly in the event that there is nonappearanceof clinical improvement after a generally deep rooted treatment(我們可能想要敦促臨床醫生持續重新審視他們的選擇,特別是在經過一段通常根深蒂固的治療后仍缺乏臨床改善的情況下)
EIMs address the primary driver of horribleness in Compact disc(EIMs應對了Compact disc中恐怖性的主要驅動因素)(注:作者可能指克羅恩病Crohn’s Disease)
In the last option study, the chances proportionwas 2.66 (95% certainty stretch = 1.08-6.54) contrasted with everybody(在最后一項研究中,與所有人相比,機會比例為2.66 [95%確定性區間=1.08-6.54])(注:Chances proportion = odds ratio; certainty stretch = confidence interval)
![]()
將單個病例報告篡改為20名患者的研究
在這個預印本中,作者詳細描述了20名“挑釁性內臟疾病(provocative entrail illness)”(即炎癥性腸病)患者:所有人均有3天病程、近期有“不規則腹痛伴不連貫荒謬的便血(irregular stomach torment alongside discontinuous ridiculous stools as of late)”,且均在兩天前接觸過“兒童(youngsters)”。
等等,20人全部如此?
其血液檢測結果未以均值呈現,而是以具體數值列出:“入院當日血檢顯示C反應蛋白86 mg/L,白細胞計數正常,無缺鐵性貧血(血紅蛋白110 g/L)。肝胰酶、肌酐、尿素電解質等指標正常。白蛋白偏低(26 g/L),與數周前一致。”
這聽起來更像單次血檢結果,而非20名患者的數據集。
原文不難追溯到(記住:存在扭曲短語的文本為抄襲,將其還原為標準生物醫學表述即可定位被抄襲的文章)。
該奇特論文抄襲的源頭是Orfei等于2019年發表于《BMJ Case Reports》的IBD患者病例報告[3]。預印本論文的作者似乎篡改了該病例報告,偽造成20名患者的研究。
下圖并排對比2019年《BMJ Case Reports》論文(左)與2023年medRxiv預印本(右)。已對部分句子顏色標注以便對照。
![]()
左:2019年《BMJ Case Reports》的原文;右:2023年medRxiv預印本
![]()
還抄襲了美國健康訪談調查研究的數據
該預印本文章繼續展示“20名患者”的“數據”。表1和表2列出吸煙狀況、BMI、偏頭痛等特征。文中寫道:“經年齡調整的偏頭痛或嚴重頭痛總患病率為15.4%(n=9,062),IBD患病率為1.2%(n=862)”。20名患者的研究出現如此巨大的“n”,極不合理。
使用表1的部分數據,也可以輕易定位到源頭:所有數值與Yong Liu等在《Headache》(2021)的研究完全一致[4]。該研究基于2015-2016年60,436名美國成年人的國家健康訪談調查(NHIS)數據——遠不止20人!
下圖并排對比2021年NHIS數據與2023年預印本,數值完全相同。
![]()
左:2021年《Headache》的原文;右:2023年medRxiv預印本
該預印本可能還剽竊了其他論文,但當前證據已確鑿:數據至少復制了兩篇論文,并通過同義詞替換掩蓋抄襲。
目前博客作者已在medRxiv網站留言并向預印本平臺組織舉報了這篇“杰作”。
參考文獻:
1. https://arxiv.org/abs/2107.06751
2. https://www.medrxiv.org/content/10.1101/2023.02.05.23285412v1
3. https://casereports.bmj.com/content/12/1/e227228.long
4. https://pmc.ncbi.nlm.nih.gov/articles/PMC8289487
文章整理自:https://scienceintegritydigest.com/2025/07/28/discontinuous-ridiculous-stools-a-preprint-full-of-tortured-phrases-and-stolen-data/-4053
醫咖會9周年
驚喜第一彈來啦!
醫咖會基礎會員全面大升級,趕快去領取一年基礎會員!
基礎會員權益:28張基礎課程券,基礎課程均可兌換!醫咖會SCI-AI工具,科研內容訓練,回復更專業!
點擊“閱讀原文”/應用商店搜索/掃碼下載醫咖會APP,登錄后,彈窗領取基礎會員!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.