
從今天開始,我們專注發一系列的技術貼!
從易到難,每天學習一點,所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個這個系列就叫“監測預警基礎”。
作為疾控工作者或者公衛人,我們經常聽到時間序列數據分析。那么,究竟什么是時間序列數據?我們一般會如何分析它呢?
今天一探究竟
![]()
![]()
時間序列數據是按照時間順序收集、記錄的一系列觀測值,其中時間是一個關鍵維度,其核心價值在于利用歷史中的時間模式來理解現在、預測未來。
在疾控領域,時間序列數據就可以理解為時間序列數據是按照固定時間間隔收集的、反映疾病發生、發展及防控效果的一系列觀測值,時間順序具有明確的流行病學意義。比如大疫情的發病數據、比如ILI%這樣的監測數據、比如防控措施數據以及每日溫濕度等其他相關因素數據。
時間序列數據最本制度的特征是時間依賴性,也就是說相鄰觀測值之間存在相關性,現在的值受過去值的影響,這也是與橫截面數據最本質的區別
![]()
![]()
時間序列通常由以下4個組成部分構成。
第一、趨勢:指時間序列在較長一段時間內呈現出來的持續向上或者持續向下的變動
第二、季節性:在一年內重復出現的周期性波動,如氣候條件、生產條件、節假日等
第三、周期性:一年以上的非固定周期的波動。
第四、不規則波動:也就是殘差,指除去趨勢、季節性、周期性外的隨機波動、隨機噪音,核心是 “無規律、突發且影響小”。不規則波動通常總是夾雜在時間序列中,致使時間序列產生一種波浪形或震蕩式的變動。只含有隨機波動的序列也稱為平穩序列。
一句話總結:時序數據 = 趨勢(長期方向) + 季節(固定短周期波動) + 周期(長期循環波動,有大致范圍) + 殘差(隨機小波動)。也不定包括全部4部分,比如平穩數據只有 “殘差波動”,趨勢型數據是 “趨勢 + 殘差波動”。
![]()
![]()
時間序列數據可以用數學模型分解
第一種方式:加法模型。當趨勢和季節性變化獨立作用時,季節性波動的幅度不隨時間變化時,加法模型是合適的。
![]()
Y?:時間t的觀測值
T?:趨勢成分
S?:季節成分
C?:周期成分
I?:不規則成分
第二種方式:乘法模型。當季節性效應的大小取決于趨勢的大小、季節性波動的幅度隨趨勢增長而變化時,采用乘法模型。
![]()
作為疾控人,其實我們接觸最多的時間序列數據就是發病數據,其實相應的,對于發病數據可以進行更詳細的分解,如下所示:
![]()
至于以上數據模型分解有什么意義,在這先不做詳細解釋,后面在我們介紹時間序列數據的分析中自然會講到,在這只需要有個初步概念就行。
![]()
我們一般會使用時間序列數據做以下分析:
第一、描述分析:比如采用時序圖進行可視化分析,識別趨勢、季節性,計算基本統計量 。
第二、分解分析:分離趨勢、季節、周期、隨機成分單獨分析,比如季節指數計算、或者趨勢的各種簡單或者復雜的預警模型等。
第三、預測分析:基于歷史數據預測未來,比如采用傳統時間序列模型ARIMA模型、指數平滑等。
第四、因果關系分析:分析變量間的領先滯后關系、格蘭杰因果檢驗等。
也是一樣,在實際例子中具體如何操作和使用,在后續的分析推文中我們會講解到。
![]()

編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.