有序多分类Logistic回归 (详细版)

SPSS教程回归分析
问答

点击绿色“提问”按钮

  • 针对本文提问
  • 查看历史问答

长按鼠标选中正文某句话

  • 对选中的内容进行针对性提问
一、问题与数据

研究者开展了一项患者满意度的调查,主要调查患者对医疗效果的满意程度(不满意用“0”表示;一般用“1”表示;满意用“2”表示;非常满意用“3”表示)。另外,研究者也调查了一些其它信息,包括性别gender(男性用“0”表示;女性用“1”表示)、年龄(age)、医疗费用(fee)和治疗方法treatment(药物1用“1”表示;药物2用“2”表示;药物3用“3”表示)。部分数据如图1。

 

图1 部分数据

二、对问题分析

使用有序Logistic进行回归分析时,需要考虑4个假设。 


假设1:因变量唯一,且为有序多分类变量,如血压水平可以分为高、中、低;某病的治疗效果分为痊愈、有效、无效等。


假设2:存在一个或多个自变量,可为连续、有序多分类或无序分类变量。


假设3:自变量之间无多重共线性。


假设4:模型满足比例优势假设。意思是无论因变量的分割点在什么位置,模型中各个自变量对因变量的影响不变,也就是自变量对因变量的回归系数与分割点无关。有序多分类的Logistic回归原理是将因变量的多个分类依次分割为多个二元的Logistic回归,例如本例中因变量患者满意度有4个等级,分析时拆分为三个二元Logistic回归,分别为(0 vs 1+2+3) 、(0+1 vs 2+3)和(0+1+2 vs 3),均是较低级与较高级对比。在有序多分类Logistic回归中,假设几个二元Logistic回归的自变量系数相等,仅常数项不等,结果也只输出一组自变量的系数。因此,有序多分类的Logistic回归模型,必须对自变量系数相等的假设(即比例优势假设)进行检验(又称平行线检验)。如果不满足该假设,则考虑使用无序多分类Logistic回归。


假设1-2都是对研究设计的假设,需要研究者根据研究设计进行判断。经过分析,本研究符合假设1和假设2,那么应该如何检验假设3、假设4,并进行有序Logistic回归呢?

三、前期数据处理

对假设进行验证前,我们需要将分类变量设置成哑变量。


3.1 为什么要设计哑变量


若直接将分类变量纳入Logistic回归方程,则软件会将分类变量按连续变量处理。例如,如果把性别按“1”男性、“2”女性进行编码,然后直接把性别纳入方程,方程会认为“女性”是“男性”的2倍。为了解决这个问题,需要用一系列的二分类变量“是”或“否”来表示原始的分类变量,这些新的二分类变量被称为“哑变量”。


在SPSS软件的二项Logistic回归模型中,将分类变量选入categorical,软件会自动设置一系列的哑变量。由于验证假设3需要通过线性回归实现,而在线性回归中,就需要手动设置哑变量。因此,这里需要先手动设置哑变量。


3.2 设置哑变量的思路


哑变量的数目是分类变量类别数减1。本例中,药物1、药物2和药物3的原始编码为1、2和3。设置哑变量时,需要对药物1和药物2进行重新编码。建立新变量Drug1(药物1),若调查对象治疗服用的药物1,则Drug1编为“1”,代表是;若未服用药物1,则Drug1编为“0”,代表否。同样,建立新变量Drug2(药物2),将是否服用药物2编为“1”或“0”。此时,若既未服用药物1,又未服用药物2,则两个新变量Drug1和Drug2的编码都为“0”,代表药物3。此时,药物3在模型中是参考类别(Reference)。

四、SPSS操作
请先登录
这么重要的内容,赶快登录查看吧!
五、结果解释
请先登录
这么重要的内容,赶快登录查看吧!
六、撰写结论

运用符合比例优势假设的有序Logistic回归分析年龄、性别、医疗费用、治疗方法对患者治疗满意度的影响。平行线检验的结果为χ2=14.171,P=0.165,说明比例优势假设存在。Deviance拟合优度检验显示模型拟合好,χ2=377.833,P=1.000,但是有大部分(74.7%)频数为0的单元格。模型拟合优度检验显示,本模型优于只有常数项的模型,χ2= 99.763,P < 0.001。男性认为“治疗满意度高”的OR值是女性的1.976倍(95%CI:1.112-3.511),χ2=5.389,P=0.020。以服用药物3治疗的患者为对照组,服用药物1治疗的患者认为“治疗满意度高”的OR值是服用药物3治疗的患者的1.033倍 (95%CI:0.502-2.125),χ2= 0.008,P= 0.931;服用药物2认为“治疗满意度高”的OR值是服用药物3治疗的患者的3.133倍(95%CI:1.584 -6.190),χ2 = 10.780,P=0.001。年龄每增加一岁,认为“治疗满意度高”的OR值是原来的1.260倍(95%CI:1.182-1.343),χ2 = 49.659,P<0.001。医疗费用每增加一元,认为“治疗满意度高”的OR值是原来的1.007倍(95%CI:1.003-1.011),χ2 = 11.342,P=0.001。

七、延伸阅读

利用其它模块计算OR值


上述Analyze→Regression→Ordinal模块,可以检验 “比例优势”假设,但无法给出OR值和95%CI。而Analyze→Generalized Linear Models→Generalized Linear Models模块可以给出OR值和95%CI。


7.1 SPSS操作


在主界面点击Analyze→Generalized Linear Models→Generalized Linear Models。出现Generalized Linear Models对话框后,在Ordinal Response下选择Ordinal logistic,如图23。

 

图23 Generalized Linear Models对话框


点击Response,出现 Response对话框。将patient_satisfaction选入Dependent Variable,下方的category order行可以选择Ascending或Descending。本例中patient_satisfaction共有四个等级,“0”表示“非常不同意”。如果选择ascending,则“0”是最低的等级;如果选择Descending,则表示“0”为最高的等级。如图24。

 

图24 Generalized Linear Models:Response


点击上方的Predictors,在Predictors对话框中,将gender和treatment选入Factors,将age和fee选入Covariates。如图25。

 

图25 Generalized Linear Models:Predictors


点击Model,在Model对话框中,将gender、treatment、age和fee选入右侧的Model中,如图26。

 

图26 Generalized Linear Models:Model


点击Estimation,在Estimation对话框中,选择Method下拉框中的Fisher,如图27。

 

图27 Generalized Linear Models:Estimation


点击Statistics,在Statistics对话框中,保持原始设置,再勾选Print下的Include exponential parameter estimates,勾选该选项会输出OR值及其95%的置信区间,然后点击OK。如图28。

 

图28 Generalized Linear Models:Statictics


7.2 结果解释


Generalized Linear Models模块不会给出单元格信息、伪决定系数和平行线检验结果。模型拟合信息在Ominibus Test表中,该结果与Regression→Ordinal的Model Fitting Information结果一致。如图29。

 

图29 Ominibus Test


参数估计的OR值和95%CI见图30。

 

图30 Parameter Estimates

请先登录
这么重要的内容,赶快登录查看吧!
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
Next
Previous
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题