![]()
系列簡(jiǎn)介
這是我們一系列原創(chuàng)技術(shù)貼,從易到難,每天學(xué)習(xí)一點(diǎn)。所有內(nèi)容均為疾控?cái)?shù)據(jù)分析、科研論文相關(guān),或者說(shuō)很多和現(xiàn)在的熱門監(jiān)測(cè)預(yù)警相關(guān),所以我們這個(gè)系列就叫“監(jiān)測(cè)預(yù)警基礎(chǔ)”。
今天是第19節(jié),在上一節(jié)我們講了回歸基本理論的基礎(chǔ)上,講一下回歸最簡(jiǎn)單的操作,以便后續(xù)內(nèi)容的開(kāi)展。
我們這節(jié)課的主要目的還是為后面的Serfling回歸模型打基礎(chǔ)。
當(dāng)然了,本身回歸我們就是經(jīng)常會(huì)用到的,尤其是如何在excel和SPSS這種易于操作的軟件中進(jìn)行更是疾控人必須掌握的技能。
![]()
首先,在excel中進(jìn)行回歸分析不一定所有的軟件都可以,如【分析】選項(xiàng)中不存在【數(shù)據(jù)分析】選項(xiàng)就不行,需要進(jìn)行設(shè)置才可以,設(shè)置步驟如下,也很簡(jiǎn)單,設(shè)置了之后你的excel不只可以做回歸分析,還可以進(jìn)行以下很多統(tǒng)計(jì)分析。
![]()
1.設(shè)置步驟如下:
點(diǎn)擊【文件】主模塊,在彈出的對(duì)話框中用鼠標(biāo)單擊【選項(xiàng)】按鈕。
![]()
或者![]()
在彈出的【Excel選項(xiàng)】對(duì)話框的列表中點(diǎn)擊【加載項(xiàng)】選項(xiàng),然后點(diǎn)擊對(duì)話框最下方的【轉(zhuǎn)到】按鈕。
![]()
在彈出的【加載項(xiàng)】對(duì)話框中勾選【分析工具庫(kù)】,點(diǎn)擊確定;
![]()
點(diǎn)擊excel軟件中【數(shù)據(jù)】主模塊,找到【分析】選項(xiàng),點(diǎn)擊【數(shù)據(jù)分析】就可以進(jìn)行相應(yīng)的統(tǒng)計(jì)分析了。
2.用excel做簡(jiǎn)單線性回歸
假設(shè)我們有這樣2個(gè)變量的數(shù)據(jù)
![]()
點(diǎn)擊“數(shù)據(jù)”選項(xiàng)卡,然后點(diǎn)擊“數(shù)據(jù)分析”;
選擇“分析工具“中的”回歸“,然后點(diǎn)擊”確定“按鈕;
在”Y值輸入?yún)^(qū)域“中輸入因變量y的數(shù)據(jù)范圍,在”X值輸入?yún)^(qū)域”中輸入自變量x的數(shù)據(jù)范圍;
如果選中的數(shù)據(jù)第一行是變量名而非數(shù)值,則勾選“標(biāo)志”復(fù)選框,否則無(wú)需勾選。
![]()
好了,點(diǎn)擊之后就可以輸出結(jié)果
我們對(duì)結(jié)果的解讀如下,很仔細(xì)了。
![]()
當(dāng)然,對(duì)于簡(jiǎn)單線性回歸來(lái)說(shuō)我們還是要說(shuō)一下,做一個(gè)趨勢(shì)性,然后顯示公式,其常數(shù)項(xiàng)和回歸系數(shù)其實(shí)我們也就知道了。
![]()
3.用excel做多元線性回歸
在excel中進(jìn)行多元線性回歸其實(shí)和簡(jiǎn)單線性回歸的方式一模一樣,只是在選擇數(shù)據(jù)自變量的之后,簡(jiǎn)單線性回歸是只有一列,而多元線性回歸就是納入多列。
結(jié)果輸出也是一樣,在回歸系數(shù)這個(gè)表中,如下圖,會(huì)依次給出各個(gè)自變量的回歸系數(shù)和統(tǒng)計(jì)檢驗(yàn)值。
![]()
但是我們得說(shuō)明一點(diǎn),excel中,如果出現(xiàn)缺失值,比如下圖自變量3出現(xiàn)幾個(gè)缺失值,是無(wú)法進(jìn)行回歸分析的。
![]()
![]()
相比Excel,用SPSS進(jìn)行回歸分析可以做更多的統(tǒng)計(jì),當(dāng)然,回歸方式也很多。
比如我們熟知的logistic回歸分析,就是我們?cè)赟PSS中進(jìn)行會(huì)進(jìn)行的,今天我們的重點(diǎn)不是SPSS各種回歸方式介紹,避免跑題,我們也就不多說(shuō),只說(shuō)和我們線性回歸。
1.SPSS做簡(jiǎn)單線性回歸
準(zhǔn)備好需要分析的數(shù)據(jù),依次點(diǎn)開(kāi):
分析(Analyze)→回歸(Regression)→ 線性(L)
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
2.SPSS簡(jiǎn)單線性回歸中的分層回歸(層次回歸)
本質(zhì)上是建立在回歸分析基礎(chǔ)上,區(qū)別在于分層回歸可分為多層,用于研究?jī)蓚€(gè)或者多個(gè)回歸模型之間的差異。分層回歸將核心研究的變量放在最后一步進(jìn)入模型,以考察在排除了其他變量的貢獻(xiàn)的情況下,該變量對(duì)回歸方程的貢獻(xiàn),如果變量仍然有明顯的貢獻(xiàn),那么就可以做出該變量確實(shí)具有其他變量所不能替代的獨(dú)特作用的結(jié)論。
這種方法主要用于,當(dāng)自變量之間有較高的相關(guān),其中一個(gè)自變量的獨(dú)特貢獻(xiàn)難以確定的情況。常用于中介作用或者調(diào)節(jié)作用研究。
![]()
![]()
![]()
![]()
![]()
![]()
其他結(jié)果不再贅述,詳情看第一部分的分析結(jié)果。
3.逐步回歸
逐步回歸分析方法的基本思路是自動(dòng)從大量可供選擇的變量中選取最重要的變量,建立回歸分析的預(yù)測(cè)或者解釋模型。其基本思想是:將自變量逐個(gè)引入,引入的條件是其偏回歸平方和經(jīng)檢驗(yàn)后是顯著的。
同時(shí),每引入一個(gè)新的自變量后,要對(duì)舊的自變量逐個(gè)檢驗(yàn),剔除偏回歸平方和不顯著的自變量。這樣一直邊引入邊剔除,直到既無(wú)新變量引入也無(wú)舊變量刪除為止。它的實(shí)質(zhì)是建立“最優(yōu)”的多元線性回歸方程,可利用逐步回歸篩選并剔除引起多重共線性的變量。
![]()
![]()
![]()
其他結(jié)果不再贅述,詳情看第一部分的分析結(jié)果。
好了,最后我們還有一個(gè)重點(diǎn)要說(shuō),和EXCEL不一樣,SPSS中當(dāng)部分變量出現(xiàn)缺失值時(shí),他依然可以進(jìn)行回歸分析。
![]()
![]()
編輯:普通疾控人 | 審核:詩(shī)酒趁年華
文章來(lái)源 | 原創(chuàng)
說(shuō)明 | 轉(zhuǎn)載只為分享,如有侵權(quán)聯(lián)系刪除
?版權(quán)聲明 | 部分信息和圖片來(lái)自公開(kāi)網(wǎng)絡(luò)
轉(zhuǎn)載請(qǐng)注明
再次轉(zhuǎn)載請(qǐng)注明出處
![]()
科普健康 | 宣傳疾控
本號(hào)為多位疾控機(jī)構(gòu)從業(yè)者運(yùn)營(yíng)
重點(diǎn)關(guān)注國(guó)內(nèi)外健康事件
致力于疾控科普
在做好科普服務(wù)大眾的同時(shí)
做好疾控機(jī)構(gòu)的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說(shuō)明
本文為原創(chuàng)內(nèi)容,文章為個(gè)人理解所學(xué),不涉及疫情信息及內(nèi)部保密數(shù)據(jù),發(fā)表的目的為自我總結(jié)及給有需求的人士學(xué)習(xí)使用。如有不妥之處,歡迎聯(lián)系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號(hào)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.