生存分析 基礎知識

生存分析(survival analysis)主要用來處理考慮發(fā)生時間的二分類結局變量,不僅考慮事件是否出現,而且考慮事件出現的時間長短,因此這類方法也稱為事件時間分析(time-to-event analysis)。

生存分析的資料常常分為終點事件(如死亡)和刪失(其他生存結局)兩類,

其特點有:

①?同時考慮兩個變量:生存時間和生存結局;

②?通常含有刪失數據;

③?生存時間的分布通常不服從正態(tài)分布。

什么是刪失數據(Censoring data)?

在研究結束的時候,研究對象發(fā)生了研究之外的其他事件或生存結局,無法明確從開始觀察到發(fā)生終點事件的生存時間,我們把這種類型的數據稱之為刪失數據

刪失本質就是研究數據出現了缺失,我們無法根據所有觀察對象計算“死亡速度”,難以準確探討人群的平均生存時間,比較不同組人群的生存情況。

產生刪失的可能原因

①隨訪截止,終點事件仍然沒有發(fā)生;

② 中途失訪,無法明確觀察的研究對象是否發(fā)生了終點事件和具體的發(fā)生時間;

③?研究對象由于不配合等其他原因,中途退出研究,無法繼續(xù)進行隨訪;

④?研究對象死于其他事件,例如因其他疾病造成死亡。

以終點時間為肝癌死亡為例

生存期必須知道的幾個概念

總體生存期(overall survival, OS?

任何原因導致的死亡,只關心是否死亡,不關心因為何種原因死亡。

疾病特異性生存期disease?specific?survival,?DSS

結局指標為由特定疾病導致的死亡,反映特定疾病的臨床獲益。但患者的死因經常并不容易明確。這時候開始關心死亡的原因是否是由特定疾病導致的。如果不是特定疾病導致的則不計入結局指標。在沒有DSS.time的數據中,可以用OS.time來替代。

無進展生存期progression?free?survival,?PFS?

疾病經過治療后沒有出現進一步惡化的生存期,結局指標是發(fā)生惡化或死亡。要求對發(fā)生惡化的標準進行明確的定義。

無病生存期disease?free?survival, DFS

從隨機化開始至疾病復發(fā)或由于疾病進展導致患者死亡的時間,不關心因為何種原因死亡。要求對發(fā)生復發(fā)的標準進行明確的定義。

一定要明確結局的定義

結局不僅僅指的是生命是生、是死的數據;還可以是研究者感興趣的陽性終點事件。

如研究某病治療后的復發(fā)情況,復發(fā)定為終點事件。在生存分析中,發(fā)生終點事件發(fā)生(復發(fā))記為“1”,刪失記為“0”。

生存分析的主要方法

非參數法:Log rank檢驗等

一般腫瘤治療藥物臨床試驗會采用Log rank檢驗法。Log rank檢驗對晚期死亡事件權重較大,對數據分布的要求較低,主要用于比較兩組生存曲線是否存在差異,回答“是否有效”的問題,但無法衡量效果大小,P值作為試驗主要結局是否陽性的依據。

Wilcoxon檢驗也屬于非參數檢驗法,但對早期死亡事件權重更大。

半參數法:Cox回歸分析

考慮隨訪時間,用Cox回歸獲得HR,更直觀地測量治療效果。

Kaplan-Meier法

Kaplan-Meier法估計的生存率是一個累積的生存率,或者說是一個條件的生存率,前面的條件再乘以當前的生存率,通常用生存曲線描述生存過程。

生存曲線中,中位生存時間就是縱坐標=0.5(即生存率在50%的時候所對應的時間)。

中位生存時間不能簡單地理解為“死亡人數到了一半”,因為有些受試者中途失訪或隨訪結束也沒有發(fā)生結局。嚴格來說就是累積生存率=0.5的時候所對應的時間t。

有時候中位生存時間估計不出來,因為發(fā)生“死亡”的人數太少,這時就報道為某個時間點的生存率(如1年生存率、5年生存率等),或者報道平均生存時間(如果數據不是很偏態(tài))。

不同的生存分析內容,選擇不同的分析策略

計算生存率、中位生存時間、用生存曲線描述生存過程:Kaplan-Meier法

生存時間分布的組間比較:log Rank

探討生存時間(生存速度)的影響因素:Cox回歸分析。

?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容