Member-only story

[SAS]存活分析(1) KM存活曲線

wenwu
6 min readDec 13, 2019

--

免費閱讀文章:[SAS]存活分析(1) KM存活曲線 Kaplan-Meier Method

在醫學上,若我們想要了解某疾病的死亡率以及存活率,可以使用存活分析。 通常我們會設定一個起始時間,像是確診某疾病的時間或是接受手術的時間點,並且觀察特定事件(event)(死亡或疾病復發),進一步計算疾病的存活率。

存活分析的資料特色

  1. 依變項(Y)同時為連續且具有類別的性質
  2. 設限資料

在一般我們使用的分析中,資料不是連續資料就是類別資料,但是存活分析所記錄的資料同時具有這兩種特性。在依變項(Y)中,不只需要紀錄病人的觀察時間,並且需要紀錄在研究結束前,病人的生存與否。

比方說我們研究的時間為今年的一月到十月,A病人從2月確診得了乳癌,8月份時死亡,表示A病人最終死亡(event),且存活6個月。
B病人3月確診,到結束研究時還活著,代表event沒有發生,我們知道這位病人至少存活了7個月,同時這位病人也是設限資料。

什麼是設限資料呢?
在收集資料的過程中,時常發生追蹤不到的情形(轉院,換了電話),或是病人因其他原因(車禍)死亡,我們不想讓這些情況影響到研究結果,所以當1.研究結束時,病人並沒有發生特定事件(event) 2.在研究過程中病人失聯或是被剃除了 我們就把這種情況是為設限(censor )

除了B病人是設限資料之外,假設C病人在3月時確診,5月時C病人轉院\失聯,那C病人也同樣是設限資料

Kaplan-Meier 存活曲線

KM 存活曲線可以看見每個時間的存活率,並且為遞減的函數
要如何繪製KM survival plot 呢? 我們使用SAS 來繪製

example for SAS

這邊先提供SAS code ,基本上給好資料 追蹤時間 還有是否死亡就行了
STRATA 可以選擇要不要,如果沒有寫的畫會跑出全部的存活率,下面會示範兩種情形!

PROC LIFETEST DATA=survival
METHOD=KM PLOTS=(S);
TIME months*dead(0);
STRATA group;
RUN;

資料如下,有20位病人追蹤的月份,死亡與否(dead=1為死亡),性別

Data data_survival;
input id time status sex$ @@;
datalines;
1 121.98680 1 M 2 66.33585 0 F 3 101.31992 1 M 4 120.96599 1 F
5 30.89584 1 M 6 88.88542 0 M 7 114.43314 0 F 8 76.36350 0 M
9 139.02362…

--

--

wenwu
wenwu

Written by wenwu

離開學校之後,需要一點激勵來持續學習的動力。想到什麼寫什麼,趁著還沒忘記之前通通都寫下來。

Responses (2)