為什么要估算樣本量？

2025-09-04 20:00:09　來源: 醫(yī)咖會

北京舉報

分享至

本文內(nèi)容整理自醫(yī)咖會《樣本量計算的理論+實操》專欄，小咖針對其中關(guān)于“為什么估算樣本量”的內(nèi)容進行了整理，可點擊左下角“閱讀原文”查看完整視頻。

樣本量估算起源于臨床試驗。早期上市試驗的發(fā)起方一般為藥企，開始前必須考慮經(jīng)費、招募規(guī)模、足以滿足上市需求的結(jié)果評價的成本等等。后來，臨床不同科室、不同專業(yè)都會進行臨床研究，其中也包括臨床試驗。

隨著越來越多的臨床試驗的開展，人們逐漸意識到，想要得到一個真實的、有意義的結(jié)果，對于研究質(zhì)量的考量在研究設(shè)計階段必不可少。在這個過程中，樣本量估算逐漸受到重視。

樣本量過大或過小都有缺點。樣本量過大時，可能會經(jīng)費不足，更重要的是實際操作難度較大，比如質(zhì)控，四大期刊都傾向于多中心研究，其存在具有代表性等諸多優(yōu)勢，但其質(zhì)控需要嚴格把控。樣本量大到一定程度，足以獲得統(tǒng)計效能來檢驗組間差異之后，繼續(xù)增加樣本量可能就比較浪費。

樣本量過小，操作簡單，但可能檢驗效能低到根本不足以檢出差異。就像一些陰性結(jié)果的研究局限性部分，常見其將陰性原因歸咎于樣本量過小，但其實并不一定。

其實，估算樣本量主要是為了克服抽樣誤差。臨床研究一般是想通過抽樣的樣本人群得出結(jié)論，然后推廣到總體目標人群，是從樣本到整體的一個過程。而抽樣人群的數(shù)據(jù)是碰巧存在的，還是真實存在的？這就需要應(yīng)用統(tǒng)計學來處理。

這種利用樣本信息對相應(yīng)總體的特征進行的推斷稱為統(tǒng)計推斷。而處理上述問題時，“對所估計的總體首先提出一個假設(shè)，然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè)”的過程，就是常說的假設(shè)檢驗。

如果來自同一總體抽取的兩個樣本，其差異是因為抽樣誤差，對應(yīng)到統(tǒng)計學中即“P>0.05”，無統(tǒng)計學意義。而如果來自兩個總體分別抽取的樣本，其差異是本質(zhì)不同引起的，對應(yīng)到統(tǒng)計學中即“P<0.05”，有統(tǒng)計學意義。

在假設(shè)檢驗中，有兩個概念和樣本量估算有關(guān)，其一為I類錯誤，也就是假陽性錯誤，常稱棄真假設(shè)；II類錯誤為存?zhèn)巍?yīng)的統(tǒng)計學參數(shù)為α和β，前者對應(yīng)的是可信度，也就是常見的顯著性水平P值預(yù)設(shè)的0.05；后者1-β對應(yīng)的是把握度，代表兩總體確實有差別時，差別被檢出的能力。

那么P值有什么意義呢？舉例來講，如果兩組（A vs B）的有效率是固定的，不同樣本量的P值如下圖，第三種情況P<0.05，但處于臨界狀態(tài)，稍有變動可能就會出現(xiàn)組間差異不顯著的情況。因此，研究者不應(yīng)神化P值。

臨床研究的設(shè)計中，樣本量只是統(tǒng)計學解決的問題之一。估算樣本量并不是套公式就可以簡單計算的，而是一個系統(tǒng)的工作，必須對研究者計劃的療效指標、隨訪情況、組內(nèi)變異、α、β等等都有一定的了解。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.