哈嘍,大家好,今天小墨這篇評論,主要來分析科學家也會被偏見綁架,數據證實預期時反而最該警惕。
![]()
有個實驗挺有意思。研究人員給171個計算機專業的大學生看了同一張數據圖,圖上是關于財富和幸福值關系的數據點。在看圖之前,他們先問這些學生預期兩者是什么關系。結果70%的人說應該是正相關,剩下30%說是負相關。
![]()
有意思的地方來了。那些預期正相關的學生,得出正相關結論的比例,是預期負相關學生的兩倍多。同一張圖,預期不同,看出來的東西就不一樣。這張圖實際上暗藏玄機,總體看是負相關,分年齡組看又是正相關,典型的辛普森悖論。問題是大部分人壓根沒深究這個矛盾,直接按自己預期給出了答案。
![]()
去年有個研究更夸張。73個專業團隊拿到同一組數據,去驗證同一個假設。結果各個團隊給出的結論差異大到離譜。有的說顯著支持,有的說完全不支持,用的明明是一模一樣的原始數據。
![]()
研究人員最后得出個結論,研究設計的可變性構成了一個龐大的宇宙,這個宇宙通常隱藏在視野之外。說人話就是,數據怎么處理、用什么方法分析,這些選擇空間太大了,不同的人做出來的東西完全不一樣。
另一個功能磁共振的研究也類似。70個獨立團隊分析同樣的腦成像數據,檢驗9個假設。沒有任何兩個團隊用的分析流程是一樣的,好幾個團隊基于同一組數據,報告了完全矛盾的統計顯著結果。
這些研究說明一個事,數據不會自己說話,得靠人去解釋。解釋的時候,人的偏見就進來了。你相信什么,你就更容易從數據里看出什么。
![]()
去年底《自然》上發表了個關于動物胚胎發育的研究。研究團隊比較了十個不同門類動物的基因表達,本來預期會看到發育中期的共有模式,結果發現完全相反。不同門類之間,反倒是早期和晚期更相似,中期差異最大。
![]()
這個結果跟之前同一個門內部的研究矛盾。研究團隊沒有硬解釋,而是退回去重新思考。最后他們意識到,這兩種矛盾的模式其實對應不同的演化時間尺度。門內部看是沙漏形狀,門之間看是反沙漏形狀。這個矛盾反倒幫他們找到了動物門類的分子定義。
這個案例說明,遇到矛盾不是壞事。問題是很多研究者看到矛盾就繞開了,或者干脆忽略掉不符合預期的那部分數據。心理學把這種傾向叫"確認偏誤",就是人天生喜歡找支持自己觀點的證據,對反對的證據視而不見。
中世紀那些有害的醫療方法能延續幾百年,就是因為只有康復的病人被記住了,死掉的就當沒看見。現在很多替代醫學也是這個路數,只宣傳有效的案例,失敗的案例從來不提。
![]()
![]()
臨床試驗為什么能避開這些問題?因為它們有一整套嚴格的流程。研究方案必須預先注冊,數據設盲,分析方法提前規定好,不能事后調整。這些機制專門用來對抗人的偏見。
基礎研究就不一樣了。很多時候開始分析數據之前,研究者自己也不知道會得到什么結果。高通量數據集尤其如此,里面包含的信息常常超出預期。這種情況下,如果一開始就有明確假設,反倒可能錯過意外的發現。
![]()
科學的客觀性不是天然存在的,是靠機制和方法保障出來的。承認科學家會有偏見,主動去找數據里的矛盾,才能真正接近真相。遇到矛盾不是失敗的信號,是進步的開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.