為什么這一篇很重要?
做數(shù)據(jù)分析、質(zhì)量管理、學(xué)術(shù)研究,你一定繞不開"假設(shè)檢驗"這個詞。但很多人都是:
? P值小于0.05就拒絕原假設(shè),但不知道為什么
? 面對不同數(shù)據(jù)類型,不知道該用T檢驗還是卡方檢驗
? 回歸分析只看R2,完全忽略了失擬項和彎曲項檢驗
今天這篇,把假設(shè)檢驗的核心知識一次性講透,從P值判斷邏輯到方法選擇矩陣,直接上手就能用。
P值判斷,一張表記住就夠用了
項目
原假設(shè) (H0)
備擇假設(shè) (H1)
P值解讀
數(shù)據(jù)正態(tài)性檢驗
正態(tài)分布
非正態(tài)分布
P<0.05 = 不服從正態(tài)分布
相關(guān)系數(shù)檢驗
系數(shù)=0,不相關(guān)
系數(shù)≠0,相關(guān)
P<0.05 = 存在顯著相關(guān)性
回歸:效應(yīng)項
模型無效
模型有效
P<0.05 = 模型顯著
回歸:失擬項
無失擬
有失擬
P<0.05 = 存在失擬(壞事)
回歸:彎曲項
無彎曲
有彎曲
P<0.05 = 存在彎曲(需調(diào)整模型)
測量系統(tǒng):線性/偏倚
無偏倚
有偏倚
P<0.05 = 存在偏倚
列聯(lián)表:卡方檢驗
無關(guān)聯(lián)
有關(guān)聯(lián)
P<0.05 = 變量間存在關(guān)聯(lián)
核心邏輯:P值 < 顯著性水平(通常0.05)→ 拒絕原假設(shè)
假設(shè)檢驗最難的不是計算,而是選對方法。記住這個三步流程:
第一步:確定總體數(shù)量(單/雙/多)
第二步:確定檢驗類型(均值/方差/比率/位數(shù))
第三步:考慮數(shù)據(jù)分布(正態(tài)分布 vs 任意分布)
單總體檢驗(1組數(shù)據(jù))
表格
檢驗類型
方法
適用場景
均值
δ已知:單樣本Z檢驗
δ未知:單樣本T檢驗
檢驗樣本均值是否等于某個目標(biāo)值
方差
單方差檢驗 / 圖形化匯總(只求CI)
檢驗樣本方差是否穩(wěn)定
比率
單比率檢驗
檢驗合格率、通過率等比例指標(biāo)
位數(shù)
單樣本符號檢驗 / Wilcoxon符號秩檢驗
非正態(tài)分布時的中位數(shù)檢驗
雙總體檢驗(2組數(shù)據(jù))
表格
檢驗類型
方法
適用場景
均值
獨(dú)立樣本:雙樣本T檢驗
配對樣本:配對T檢驗
比較兩組數(shù)據(jù)均值差異(如前后對比)
方差
正態(tài)分布:雙方差檢驗 / F檢驗
任意分布:雙方差檢驗 / Levene檢驗
檢驗兩組數(shù)據(jù)方差是否相等
比率
雙比率檢驗
比較兩組合格率差異
位數(shù)
Mann-Whitney檢驗
非正態(tài)分布時的兩組數(shù)據(jù)比較
多總體檢驗(3組及以上數(shù)據(jù))
表格
檢驗類型
方法
適用場景
均值
方差相等:方差分析 / 單因子
方差不等:宏指令%Welchs
比較多組均值差異
方差
正態(tài)分布:等方差檢驗 / Bartlett檢驗
任意分布:等方差檢驗 / Levene檢驗
檢驗多組數(shù)據(jù)方差齊性
比率
原始數(shù)據(jù):交叉分組表和卡方檢驗
列聯(lián)表:卡方檢驗(工作表中的雙向表)
比較多組比例差異
位數(shù)
Kruskal-Wallis檢驗 / Mood中位數(shù)檢驗
非正態(tài)分布時的多組數(shù)據(jù)比較
避坑指南(必看) ?? 常見誤區(qū)1:直接做T檢驗,不檢驗正態(tài)性
正確做法:先用正態(tài)性檢驗(如Anderson-Darling檢驗),P<0.05說明數(shù)據(jù)不服從正態(tài)分布,應(yīng)使用非參數(shù)檢驗(如Mann-Whitney檢驗)
?? 常見誤區(qū)2:回歸分析只看R2,忽略失擬項
正確做法:
效應(yīng)項P<0.05:模型有效
失擬項P<0.05:存在失擬,模型擬合不好,需要重新建模
彎曲項P<0.05:存在彎曲,需要加入高階項
記住:模型有效 ≠ 模型擬合好
?? 常見誤區(qū)3:多組比較用多次T檢驗
正確做法:使用方差分析(ANOVA),再用事后檢驗(如Tukey法)確定哪兩組有差異
原因:多次T檢驗會顯著增加第一類錯誤的概率
實(shí)戰(zhàn)案例 案例1:檢驗新工藝是否提升了產(chǎn)品合格率
場景:原來合格率85%,改進(jìn)后抽取100件,合格率90%,是否顯著提升?
方法選擇:
總體數(shù)量:單總體
檢驗類型:比率
方法:單比率檢驗
結(jié)果解讀:P<0.05 → 拒絕原假設(shè)(合格率無提升)→ 結(jié)論:新工藝顯著提升了合格率
案例2:比較三種不同供應(yīng)商的產(chǎn)品尺寸穩(wěn)定性
場景:從A、B、C三家供應(yīng)商各抽取30件產(chǎn)品,測量尺寸,比較方差差異
方法選擇:
總體數(shù)量:多總體
檢驗類型:方差
方法:等方差檢驗 / Bartlett檢驗(假設(shè)數(shù)據(jù)服從正態(tài)分布)
結(jié)果解讀:
P<0.05 → 拒絕原假設(shè)(方差相等)→ 三家供應(yīng)商的尺寸穩(wěn)定性存在顯著差異
進(jìn)一步用事后檢驗確定哪家最穩(wěn)定
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.