SPSS详细教程:Cox回归中,分类变量的PH假定检验

专题合集更多教程

作者:龚志忠

 

英国统计学家D.R.Cox于1972年提出的比例风险回归模型(Proportional hazard regression model),简称Cox回归模型,有效地解决了对于生存资料进行多因素分析的问题。

 

但是Cox回归模型在应用时,有一个非常重要的前提条件,即比例风险(Proportional hazards)假定,简称PH假定。

 

PH假定的基本假设为:协变量对生存率的影响不随时间的改变而改变,即风险比值h(t)/h0(t)为固定值。而在实际进行生存分析的过程中,有些自变量对风险函数(事件发生概率)的影响会随时间的变化而变化,因此在构建Cox回归模型之前,必须对PH假定进行判定,只有PH假定得到满足时,Cox回归模型的结果才有意义

 

然而对于PH假定的判定往往被研究人员所忽略,而且分类变量和连续变量的判定方法也有所不同。本期内容小咖就带大家学习一下,对于分类变量,如何利用SPSS软件,简单快速的对PH假定进行判断。

 

案例数据

 

数据库变量:

1、结局变量stroke:即是否发生脑卒中,1代表发生结局,0代表未发生结局

2、分组变量treatment:即2种不同的治疗方法,取值分别为1和2

3、时间变量time:单位“月”

4、协变量age:单位“岁”

 

我们将对treatment(分类变量)这个变量进行PH假定的判定。

 

一、Kaplan-Meier生存曲线法

 

对于分类变量,检验是否满足PH假定,最常用的方法就是Kaplan-Meier生存曲线法,通过观察生存曲线是否存在交叉来进行判断。如果分类变量每一组别的Kaplan-Meier生存曲线存在交叉,提示可能不满足PH假定。但是这里需要注意的是,曲线不交叉并不代表PH假定就一定成立,仅作为检验PH假定的一个初步判断

 

具体操作步骤如下:

 

1、Analyze → Survival → Kaplan-Meier

 

 

2、将时间变量time选入“Time”框中,将结局变量stroke选入“Status”框中,并点击Define Event,定义发生事件的取值为“1”,再将分组变量treatment选入“Factor”框中。

 

3、点击Options,在Plots框中勾选“Survival”绘制生存曲线,点击Continue,最后点击OK完成操作。

 

 

4、Kaplan-Meier生存曲线

 

由Kaplan-Meier生存曲线可以看出,treatment两组生存曲线之间并未交叉,可以对分组变量treatment满足PH假定的条件做一个初步判定。

 

 

二、基于累计风险函数的图示法

 

以生存时间t为横坐标,以log[-logS(t)]为纵坐标,绘制分类变量每一组别的生存曲线,如果各个组别对应的曲线基本平行或等距,则可以判定满足PH假定。

 

具体操作步骤如下:

 

1、Analyze → Survival → Cox Regression

 

 

2、将时间变量time选入“Time”框中,将结局变量stroke选择“Status”框中,并点击Define Event,定义发生事件的取值为“1” ,再将分组变量treatment选入“Strata”框中,以treatment作为分层因素。

 

 

3、点击Plots,勾选“Log minus log”,用于绘制log[-logS(t)]对时间t的曲线,最后点击Continue和OK完成操作。

 

 

4、由log minus log图形中可以看出,在不同的时间点,treatment两组曲线几乎是平行的,因此可以判定分组变量treatment满足PH假定的条件,适宜构建Cox回归模型。

 

 

我们检验了另一个分类变量Group,得到下图的结果,可以看出,这时候就不满足PH假定了,如果不满足PH假定该怎么处理呢,我们在后续的文章中进行介绍。

 

 

在本期内容中,我们主要介绍了两种图示的方法来对分类变量进行PH假定的判定,那么对于连续型变量,可以将其转化为分类变量,按照上述操作步骤进行判定,当然也有专门针对连续变量的PH假定判定方法。我们会在后期的内容中,继续以SPSS软件为例给大家进行介绍。

 

需要使用本文数据进行练习的小伙伴,可点击文章右侧“下载资料”直接下载数据。

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题