本文內(nèi)容整理自醫(yī)咖會(huì)《R語(yǔ)言生存分析:方法,實(shí)操與臨床解讀》專欄,小咖對(duì)部分內(nèi)容進(jìn)行了整理,可點(diǎn)擊左下角“閱讀原文”查看完整視頻。
什么是生存分析?
生存分析(survival analysis)研究事件發(fā)生的時(shí)間及其發(fā)生概率。
生存分析可以處理刪失數(shù)據(jù),常見(jiàn)的是右刪失數(shù)據(jù)(right censoring)。右刪失數(shù)據(jù)指由于觀察時(shí)間結(jié)束或其他原因,僅知事件在某時(shí)間點(diǎn)尚未發(fā)生,而無(wú)法獲知具體發(fā)生時(shí)間的數(shù)據(jù)。比如有些病人在研究結(jié)束時(shí)(第3年)還活著,生存時(shí)間就是“至少3年"。
這時(shí)候就不能使用線性回歸,因?yàn)榫€性回歸要求因變量為確定觀測(cè)值,直接使用右刪失數(shù)據(jù)會(huì)導(dǎo)致生存時(shí)間低估和結(jié)果偏差;也不能使用Logistic回歸,因?yàn)長(zhǎng)ogistic回歸只關(guān)注事件是否發(fā)生,并不關(guān)注事件什么時(shí)間發(fā)生,無(wú)法捕捉事件的動(dòng)態(tài)變化,丟失時(shí)間相關(guān)信息。生存分析就可以很好的處理這種數(shù)據(jù)。
生存分析又被稱為可靠性分析、持續(xù)時(shí)間分析、事件歷史分析、時(shí)間-事件分析,除了評(píng)估治療方案效果中的死亡事件,還可以用于其他場(chǎng)景,比如再就業(yè)時(shí)間等。
生存分析能同時(shí)考慮事件發(fā)生時(shí)間和處理刪失數(shù)據(jù),精確反映事件的動(dòng)態(tài)過(guò)程,臨床上可以比較不同治療組事件發(fā)生的時(shí)間長(zhǎng)短、估計(jì)中位生存時(shí)間、分析某因素對(duì)事件發(fā)生時(shí)間的加速或延遲效應(yīng)。
生存分析的核心概念
生存分析常用的術(shù)語(yǔ):
生存時(shí)間(survival time):從一個(gè)明確起點(diǎn)到特定事件發(fā)生的時(shí)間長(zhǎng)度。事件可以是死亡、故障、復(fù)發(fā)等任何感興趣的結(jié)果。如癌癥患者從確診開始到死亡的天數(shù)。
刪失數(shù)據(jù)(censoring data):由于觀察限制,我們無(wú)法知道事件確切發(fā)生時(shí)間的樣本。即只知道事件“至少”發(fā)生了多久。
生存函數(shù)(survival function,S(t)):表示在時(shí)間t后事件仍未發(fā)生的概率。
![]()
累積分布函數(shù)(cumulative distribution function,F(xiàn)(t)):生存時(shí)間小于等于t的概率,也就是時(shí)間t之前事件已經(jīng)發(fā)生的概率。累積分布函數(shù)與生存函數(shù)互補(bǔ),所以F(t)=1- S(t)。
風(fēng)險(xiǎn)函數(shù)(hazard function,h(t)):在時(shí)間t沒(méi)有發(fā)生事件的條件下,下一瞬發(fā)生事件的條件概率速率。
![]()
至于這些函數(shù)之間的關(guān)系,比如生存函數(shù)和風(fēng)險(xiǎn)函數(shù)的關(guān)系,需要進(jìn)行一些微積分的計(jì)算,軟件可以直接計(jì)算,理解即可。
![]()
生存分析方法概覽
生存分析方法主要可以分為四類:
l非參數(shù)模型:Kaplan-Meier, Nelson-Aalen, Life Table;
![]()
l半?yún)?shù)模型:Cox proportional hazards model;
![]()
l參數(shù)模型:加速失效時(shí)間模型;
![]()
l機(jī)器學(xué)習(xí)模型:RSF。
不同的生存分析方法有相應(yīng)的典型模型和適用場(chǎng)景:
![]()
為什么選擇R實(shí)現(xiàn)生存分析?
l R可以支持多樣化模型,與學(xué)術(shù)前沿同步。
![]()
l 另外R具有功能強(qiáng)大的包,支持與Python、SAS、Stata等軟件的數(shù)據(jù)格式兼容,可讀寫CSV、Excel、SPSS、SQL等多種格式文件。
![]()
l R的圖形滿足學(xué)術(shù)出版標(biāo)準(zhǔn),可直接用于SCI期刊投稿。
![]()
l R的代碼是可重復(fù)的。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.