![]()
系列簡介
這是我們一系列原創的技術貼,從易到難,每天學習一點。所有內容均為疾控數據分析、科研論文相關,或者說很多和現在的熱門監測預警相關,所以我們這個系列就叫“監測預警基礎”。
今天是第2節,講一講我們熟悉又不完全熟悉的移動平均,這個也是后面很多操作的基礎。
時間序列數據是波動變化的,面對波動的疫情曲線,你是否也曾感到困惑?那些“7日移動平均線”究竟是怎么算出來的?它為什么比原始數據更能說明問題?
今天,我們就來徹底講清楚這個疾控數據分析中的基礎利器——移動平均。
![]()
移動平均法(MA:Moving Average Method)是一種處理時間序列數據的技術,通過對一系列連續的數據點計算平均值來平滑短期波動、揭示長期趨勢或周期性規律。比如大疫情網每天報告的病例數,會因為周末報告延遲、節假日休息、突發聚集性疫情而產生劇烈波動,移動平均通過計算連續一段時間內數據的平均值,能夠有效平滑這些隨機波動,讓我們看清疫情發展的“主干道”。
移動平均的主要用途就是 消除隨機波動,揭示長期趨勢;進行季節性分解;在信號處理中去除噪聲。
![]()
移動平均怎么計算,很簡單。比如下表是某地12月1日-15日每天流感的病例數,計算7日移動平均就是:
第7天得出移動平均值21.3,代表的是第1-7天這7天內的平均水平;
第8天得出移動平均值21.0,代表的是第2-8天這7天內的平均水平;
以此類推,這個平均值隨著時間“移動”,形成了“移動平均線”。
3日移動平均一樣的,第3得出移動平均值18.0,代表的是第1-3天這3天內的平均水平,如下表。
![]()
我們把它畫出折線可以看出更多的東西:
第一,3日移動平均前2天沒有數據,因為不夠3天;7日移動平均前6 天沒有數據,因為不夠7天。
第二,平滑效應:移動平均線比原始數據平滑得多,波動更小;窗口越寬,平滑效果越強,極端值的影響被稀釋,原始數據的"毛刺"被消除。
第三,滯后性:移動平均總是滯后于原始數據;窗口越大,滯后越嚴重;在轉折點處表現最明顯。
![]()
![]()
用途1:識別疫情真實趨勢,擺脫“日波動”干擾
場景:比如你要向領導匯報:本周疫情到底是在上升還是下降?周一102例,周二98例,周三150例(一起聚集疫情),周四85例,周五90例,周六45例(周末少報),周日55例。只看日數據,你會被周三的峰值和周日的低谷搞糊涂。應用移動平均后:計算7日移動平均,得到一條平滑曲線,發現移動平均值從上周的75例/天,穩步上升到本周的85例/天。
清晰結論:雖然日數據有波動,但疫情確實在緩慢上升。
用途2:準確判斷疫情拐點,把握防控關鍵時機
場景:實施防控措施后,需要判斷疫情是否出現“拐點”(從上升轉為下降)。
原始數據每天上下跳動,今天降一點,明天又升一點,根本看不出趨勢轉折。應用移動平均后:觀察移動平均線的斜率變化,如果移動平均線連續3天走平,然后開始掉頭向下,這很可能就是真正的“拐點”,比看日數據提前2-3天發現趨勢轉變,在防控資源調配、措施調整上,這2-3天的提前量至關重要。
用途3:構建預警模型的“基線”
場景:在傳染病自動預警系統(如我國的CIDARS)中,移動平均是構建“預期基線”的核心工具。工作流程:第一步,用多年歷史數據,計算每個時間點的移動平均值,作為“預期發病水平”,第二步,當實時數據持續高于這個移動平均基線時,系統觸發預警,這個基線會根據疾病季節性和長期趨勢。此外,可以自動調整,比如流感預警:冬季的基線自動調高,夏季的基線自動調低,實現動態預警
用途4:數據可視化和溝通展示
向公眾展示疫情趨勢時,一條平滑的移動平均線比鋸齒狀的日數據柱狀圖更易于理解,一眼看清趨勢方向;更穩定,避免因單日異常值引起不必要的恐慌;更專業,體現疾控部門對數據的深度分析能力。![]()
第一、中心化移動平均——用于計算季節指數
當需要分析疾病的季節性規律時(比如流感冬春季高峰,手足口病夏季高峰),我們會使用“中心化移動平均月度數據用12個月移動平均,季度數據用4個季度移動平均,然后再做一次中心化處理
目的是完全剔除季節性波動,分離出純粹的長期趨勢成分,從而更準確地計算各月份相對于趨勢的“季節指數”。
這里只需要知道就行,具體操作方法后面會做更詳細的講解
2. 指數加權移動平均(EWMA)——更重視近期信息
在快速變化的疫情中,上個月的數據比半年前的數據更有參考價值,指數加權移動平均會給近期數據更高的權重,比如最近一周權重40%,上一周權重30%,上上周權重20%,更早數據權重10%
這樣計算出的移動平均對趨勢變化更敏感,適用于需要快速響應的新發傳染病監測。
這里也是只需要知道就行,具體操作方法后面會做更詳細的講解。
移動平均,這個看似簡單的統計工具,實則是每位疾控工作者都應掌握的“數據望遠鏡”。它幫助我們把視線從每日波動的“浪花”上移開,聚焦于疫情發展的“洋流”方向。在信息過載、數據紛繁的今天,這種“透過現象看本質”的能力尤為珍貴。
下次當你繪制疫情曲線時,不妨加上那條移動平均線。它不會增加數據的“信息量”,但能極大提升你對信息的“理解力”。畢竟,在疫情防控這場持久戰中,看清趨勢,比追逐每一個波動更重要。
![]()
![]()
編輯:普通疾控人 | 審核:詩酒趁年華
文章來源 | 原創
說明 | 轉載只為分享,如有侵權聯系刪除
?版權聲明 | 部分信息和圖片來自公開網絡
轉載請注明
再次轉載請注明出處
![]()
科普健康 | 宣傳疾控
本號為多位疾控機構從業者運營
重點關注國內外健康事件
致力于疾控科普
在做好科普服務大眾的同時
做好疾控機構的宣傳
讓更多的人了解疾控,擁抱健康
歡迎加「小編」微信(cdcjkr126com)
本文具體說明
本文為原創內容,文章為個人理解所學,不涉及疫情信息及內部保密數據,發表的目的為自我總結及給有需求的人士學習使用。如有不妥之處,歡迎聯系小編修改、刪除。
更多精彩視頻,盡在“CDC疾控人”視頻號
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.