生存分析(survival analysis)主要用來處理考慮發(fā)生時間的二分類結局變量,不僅考慮事件是否出現,而且考慮事件出現的時間長短,因此這類方法也稱為事件時間分析(time-to-event analysis)。
生存分析的資料常常分為終點事件(如死亡)和刪失(其他生存結局)兩類,
其特點有:
①?同時考慮兩個變量:生存時間和生存結局;
②?通常含有刪失數據;
③?生存時間的分布通常不服從正態(tài)分布。
什么是刪失數據(Censoring data)?
在研究結束的時候,研究對象發(fā)生了研究之外的其他事件或生存結局,無法明確從開始觀察到發(fā)生終點事件的生存時間,我們把這種類型的數據稱之為刪失數據。
刪失本質就是研究數據出現了缺失,我們無法根據所有觀察對象計算“死亡速度”,難以準確探討人群的平均生存時間,比較不同組人群的生存情況。
產生刪失的可能原因
①隨訪截止,終點事件仍然沒有發(fā)生;
② 中途失訪,無法明確觀察的研究對象是否發(fā)生了終點事件和具體的發(fā)生時間;
③?研究對象由于不配合等其他原因,中途退出研究,無法繼續(xù)進行隨訪;
④?研究對象死于其他事件,例如因其他疾病造成死亡。
以終點時間為肝癌死亡為例

生存期必須知道的幾個概念
總體生存期(overall survival, OS?)
任何原因導致的死亡,只關心是否死亡,不關心因為何種原因死亡。
疾病特異性生存期(disease?specific?survival,?DSS)
結局指標為由特定疾病導致的死亡,反映特定疾病的臨床獲益。但患者的死因經常并不容易明確。這時候開始關心死亡的原因是否是由特定疾病導致的。如果不是特定疾病導致的則不計入結局指標。在沒有DSS.time的數據中,可以用OS.time來替代。
無進展生存期(progression?free?survival,?PFS?)
疾病經過治療后沒有出現進一步惡化的生存期,結局指標是發(fā)生惡化或死亡。要求對發(fā)生惡化的標準進行明確的定義。
無病生存期(disease?free?survival, DFS)
從隨機化開始至疾病復發(fā)或由于疾病進展導致患者死亡的時間,不關心因為何種原因死亡。要求對發(fā)生復發(fā)的標準進行明確的定義。
一定要明確結局的定義
結局不僅僅指的是生命是生、是死的數據;還可以是研究者感興趣的陽性終點事件。
如研究某病治療后的復發(fā)情況,復發(fā)定為終點事件。在生存分析中,發(fā)生終點事件發(fā)生(復發(fā))記為“1”,刪失記為“0”。
生存分析的主要方法
非參數法:Log rank檢驗等
一般腫瘤治療藥物臨床試驗會采用Log rank檢驗法。Log rank檢驗對晚期死亡事件權重較大,對數據分布的要求較低,主要用于比較兩組生存曲線是否存在差異,回答“是否有效”的問題,但無法衡量效果大小,P值作為試驗主要結局是否陽性的依據。
Wilcoxon檢驗也屬于非參數檢驗法,但對早期死亡事件權重更大。
半參數法:Cox回歸分析
考慮隨訪時間,用Cox回歸獲得HR,更直觀地測量治療效果。
Kaplan-Meier法
Kaplan-Meier法估計的生存率是一個累積的生存率,或者說是一個條件的生存率,前面的條件再乘以當前的生存率,通常用生存曲線描述生存過程。
生存曲線中,中位生存時間就是縱坐標=0.5(即生存率在50%的時候所對應的時間)。
中位生存時間不能簡單地理解為“死亡人數到了一半”,因為有些受試者中途失訪或隨訪結束也沒有發(fā)生結局。嚴格來說就是累積生存率=0.5的時候所對應的時間t。
有時候中位生存時間估計不出來,因為發(fā)生“死亡”的人數太少,這時就報道為某個時間點的生存率(如1年生存率、5年生存率等),或者報道平均生存時間(如果數據不是很偏態(tài))。
不同的生存分析內容,選擇不同的分析策略
計算生存率、中位生存時間、用生存曲線描述生存過程:Kaplan-Meier法
生存時間分布的組間比較:log Rank
探討生存時間(生存速度)的影響因素:Cox回歸分析。