有序多分类Logistic回归【详】
2017-11-22 来源: 医咖会 作者: 张耀文
一、问题与数据

研究者开展了一项患者满意度的调查,主要调查患者对医疗效果的满意程度(不满意用“0”表示;一般用“1”表示;满意用“2”表示;非常满意用“3”表示)。另外,研究者也调查了一些其它信息,包括性别gender(男性用“0”表示;女性用“1”表示)、年龄(age)、医疗费用(fee)和治疗方法treatment(药物1用“1”表示;药物2用“2”表示;药物3用“3”表示)。部分数据如图1。

 

图1 部分数据

二、对问题分析

使用有序Logistic进行回归分析时,需要考虑4个假设。 

假设1:因变量唯一,且为有序多分类变量,如血压水平可以分为高、中、低;某病的治疗效果分为痊愈、有效、无效等。

假设2:存在一个或多个自变量,可为连续、有序多分类或无序分类变量。

假设3:自变量之间无多重共线性。

假设4:模型满足比例优势假设。意思是无论因变量的分割点在什么位置,模型中各个自变量对因变量的影响不变,也就是自变量对因变量的回归系数与分割点无关。有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归,例如本例中因变量患者满意度有4个等级,分析时拆分为三个二元Logistic回归,分别为(0 vs 1+2+3) 、(0+1 vs 2+3)和(0+1+2 vs 3),均是较低级与较高级对比。在有序多分类Logistic回归中,假设几个二元Logistic回归的自变量系数相等,仅常数项不等,结果也只输出一组自变量的系数。因此,有序多分类的Logistic回归模型,必须对自变量系数相等的假设(即比例优势假设)进行检验(又称平行线检验)。如果不满足该假设,则考虑使用无序多分类Logistic回归。

目录
共61讲