哈嘍,大家好,今天小墨這篇評(píng)論,主要來(lái)分析科學(xué)家也會(huì)被偏見(jiàn)綁架,數(shù)據(jù)證實(shí)預(yù)期時(shí)反而最該警惕。
![]()
有個(gè)實(shí)驗(yàn)挺有意思。研究人員給171個(gè)計(jì)算機(jī)專業(yè)的大學(xué)生看了同一張數(shù)據(jù)圖,圖上是關(guān)于財(cái)富和幸福值關(guān)系的數(shù)據(jù)點(diǎn)。在看圖之前,他們先問(wèn)這些學(xué)生預(yù)期兩者是什么關(guān)系。結(jié)果70%的人說(shuō)應(yīng)該是正相關(guān),剩下30%說(shuō)是負(fù)相關(guān)。
![]()
有意思的地方來(lái)了。那些預(yù)期正相關(guān)的學(xué)生,得出正相關(guān)結(jié)論的比例,是預(yù)期負(fù)相關(guān)學(xué)生的兩倍多。同一張圖,預(yù)期不同,看出來(lái)的東西就不一樣。這張圖實(shí)際上暗藏玄機(jī),總體看是負(fù)相關(guān),分年齡組看又是正相關(guān),典型的辛普森悖論。問(wèn)題是大部分人壓根沒(méi)深究這個(gè)矛盾,直接按自己預(yù)期給出了答案。
![]()
去年有個(gè)研究更夸張。73個(gè)專業(yè)團(tuán)隊(duì)拿到同一組數(shù)據(jù),去驗(yàn)證同一個(gè)假設(shè)。結(jié)果各個(gè)團(tuán)隊(duì)給出的結(jié)論差異大到離譜。有的說(shuō)顯著支持,有的說(shuō)完全不支持,用的明明是一模一樣的原始數(shù)據(jù)。
![]()
研究人員最后得出個(gè)結(jié)論,研究設(shè)計(jì)的可變性構(gòu)成了一個(gè)龐大的宇宙,這個(gè)宇宙通常隱藏在視野之外。說(shuō)人話就是,數(shù)據(jù)怎么處理、用什么方法分析,這些選擇空間太大了,不同的人做出來(lái)的東西完全不一樣。
另一個(gè)功能磁共振的研究也類似。70個(gè)獨(dú)立團(tuán)隊(duì)分析同樣的腦成像數(shù)據(jù),檢驗(yàn)9個(gè)假設(shè)。沒(méi)有任何兩個(gè)團(tuán)隊(duì)用的分析流程是一樣的,好幾個(gè)團(tuán)隊(duì)基于同一組數(shù)據(jù),報(bào)告了完全矛盾的統(tǒng)計(jì)顯著結(jié)果。
這些研究說(shuō)明一個(gè)事,數(shù)據(jù)不會(huì)自己說(shuō)話,得靠人去解釋。解釋的時(shí)候,人的偏見(jiàn)就進(jìn)來(lái)了。你相信什么,你就更容易從數(shù)據(jù)里看出什么。
![]()
去年底《自然》上發(fā)表了個(gè)關(guān)于動(dòng)物胚胎發(fā)育的研究。研究團(tuán)隊(duì)比較了十個(gè)不同門類動(dòng)物的基因表達(dá),本來(lái)預(yù)期會(huì)看到發(fā)育中期的共有模式,結(jié)果發(fā)現(xiàn)完全相反。不同門類之間,反倒是早期和晚期更相似,中期差異最大。
![]()
這個(gè)結(jié)果跟之前同一個(gè)門內(nèi)部的研究矛盾。研究團(tuán)隊(duì)沒(méi)有硬解釋,而是退回去重新思考。最后他們意識(shí)到,這兩種矛盾的模式其實(shí)對(duì)應(yīng)不同的演化時(shí)間尺度。門內(nèi)部看是沙漏形狀,門之間看是反沙漏形狀。這個(gè)矛盾反倒幫他們找到了動(dòng)物門類的分子定義。
這個(gè)案例說(shuō)明,遇到矛盾不是壞事。問(wèn)題是很多研究者看到矛盾就繞開(kāi)了,或者干脆忽略掉不符合預(yù)期的那部分?jǐn)?shù)據(jù)。心理學(xué)把這種傾向叫"確認(rèn)偏誤",就是人天生喜歡找支持自己觀點(diǎn)的證據(jù),對(duì)反對(duì)的證據(jù)視而不見(jiàn)。
中世紀(jì)那些有害的醫(yī)療方法能延續(xù)幾百年,就是因?yàn)橹挥锌祻?fù)的病人被記住了,死掉的就當(dāng)沒(méi)看見(jiàn)。現(xiàn)在很多替代醫(yī)學(xué)也是這個(gè)路數(shù),只宣傳有效的案例,失敗的案例從來(lái)不提。
![]()
![]()
臨床試驗(yàn)為什么能避開(kāi)這些問(wèn)題?因?yàn)樗鼈冇幸徽讎?yán)格的流程。研究方案必須預(yù)先注冊(cè),數(shù)據(jù)設(shè)盲,分析方法提前規(guī)定好,不能事后調(diào)整。這些機(jī)制專門用來(lái)對(duì)抗人的偏見(jiàn)。
基礎(chǔ)研究就不一樣了。很多時(shí)候開(kāi)始分析數(shù)據(jù)之前,研究者自己也不知道會(huì)得到什么結(jié)果。高通量數(shù)據(jù)集尤其如此,里面包含的信息常常超出預(yù)期。這種情況下,如果一開(kāi)始就有明確假設(shè),反倒可能錯(cuò)過(guò)意外的發(fā)現(xiàn)。
![]()
科學(xué)的客觀性不是天然存在的,是靠機(jī)制和方法保障出來(lái)的。承認(rèn)科學(xué)家會(huì)有偏見(jiàn),主動(dòng)去找數(shù)據(jù)里的矛盾,才能真正接近真相。遇到矛盾不是失敗的信號(hào),是進(jìn)步的開(kāi)始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.