本文內(nèi)容整理自醫(yī)咖會《樣本量計算的理論+實操》專欄,小咖針對其中關(guān)于“為什么估算樣本量”的內(nèi)容進行了整理,可點擊左下角“閱讀原文”查看完整視頻。
樣本量估算起源于臨床試驗。早期上市試驗的發(fā)起方一般為藥企,開始前必須考慮經(jīng)費、招募規(guī)模、足以滿足上市需求的結(jié)果評價的成本等等。后來,臨床不同科室、不同專業(yè)都會進行臨床研究,其中也包括臨床試驗。
隨著越來越多的臨床試驗的開展,人們逐漸意識到,想要得到一個真實的、有意義的結(jié)果,對于研究質(zhì)量的考量在研究設(shè)計階段必不可少。在這個過程中,樣本量估算逐漸受到重視。
樣本量過大或過小都有缺點。樣本量過大時,可能會經(jīng)費不足,更重要的是實際操作難度較大,比如質(zhì)控,四大期刊都傾向于多中心研究,其存在具有代表性等諸多優(yōu)勢,但其質(zhì)控需要嚴格把控。樣本量大到一定程度,足以獲得統(tǒng)計效能來檢驗組間差異之后,繼續(xù)增加樣本量可能就比較浪費。
樣本量過小,操作簡單,但可能檢驗效能低到根本不足以檢出差異。就像一些陰性結(jié)果的研究局限性部分,常見其將陰性原因歸咎于樣本量過小,但其實并不一定。
其實,估算樣本量主要是為了克服抽樣誤差。臨床研究一般是想通過抽樣的樣本人群得出結(jié)論,然后推廣到總體目標人群,是從樣本到整體的一個過程。而抽樣人群的數(shù)據(jù)是碰巧存在的,還是真實存在的?這就需要應(yīng)用統(tǒng)計學來處理。
這種利用樣本信息對相應(yīng)總體的特征進行的推斷稱為統(tǒng)計推斷。而處理上述問題時,“對所估計的總體首先提出一個假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)”的過程,就是常說的假設(shè)檢驗。
如果來自同一總體抽取的兩個樣本,其差異是因為抽樣誤差,對應(yīng)到統(tǒng)計學中即“P>0.05”,無統(tǒng)計學意義。而如果來自兩個總體分別抽取的樣本,其差異是本質(zhì)不同引起的,對應(yīng)到統(tǒng)計學中即“P<0.05”,有統(tǒng)計學意義。
![]()
在假設(shè)檢驗中,有兩個概念和樣本量估算有關(guān),其一為I類錯誤,也就是假陽性錯誤,常稱棄真假設(shè);II類錯誤為存?zhèn)巍?yīng)的統(tǒng)計學參數(shù)為α和β,前者對應(yīng)的是可信度,也就是常見的顯著性水平P值預(yù)設(shè)的0.05;后者1-β對應(yīng)的是把握度,代表兩總體確實有差別時,差別被檢出的能力。
那么P值有什么意義呢?舉例來講,如果兩組(A vs B)的有效率是固定的,不同樣本量的P值如下圖,第三種情況P<0.05,但處于臨界狀態(tài),稍有變動可能就會出現(xiàn)組間差異不顯著的情況。因此,研究者不應(yīng)神化P值。
![]()
臨床研究的設(shè)計中,樣本量只是統(tǒng)計學解決的問題之一。估算樣本量并不是套公式就可以簡單計算的,而是一個系統(tǒng)的工作,必須對研究者計劃的療效指標、隨訪情況、組內(nèi)變異、α、β等等都有一定的了解。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.