二分类Logistic回归【简】-SPSS教程

张耀文

张耀文

医咖会

擅长:研究设计、统计分析、循证医学、样本量计算、随机化方案、数据管理
已关注
关注
2017-10-26 来源:医咖会

一、问题与数据

某呼吸内科医生拟探讨吸烟与肺癌发生之间的关系,开展了一项成组设计的病例对照研究。选择该科室内肺癌患者为病例组,选择医院内其它科室的非肺癌患者为对照组。通过查阅病历、问卷调查的方式收集了病例组和对照组的以下信息:性别、年龄、BMI、COPD病史和是否吸烟。变量的赋值和部分原始数据见表1和表2。该医生应该如何分析? 

表1. 肺癌危险因素分析研究的变量与赋值

表2. 部分原始数据

二、对问题分析

该设计中,因变量为二分类,自变量(病例对照研究中称为暴露因素)有二分类变量(性别、BMI和是否吸烟)、连续变量(年龄)和有序多分类变量(COPD病史)。要探讨二分类因变量与自变量之间的关系,应采用二分类Logistic回归模型进行分析。 在进行二分类Logistic回归(包括其它Logistic回归)分析前,如果样本不多而变量较多,建议先通过单变量分析(t检验、卡方检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再进行多因素分析,这样可以保证结果更加可靠。即使样本足够大,也不建议直接把所有的变量放入方程直接分析,一定要先弄清楚各个变量之间的相互关系,确定自变量进入方程的形式,这样才能有效的进行分析。

表3. 病例组和对照组暴露因素的单因素比较

单因素分析中,病例组和对照组之间的差异有统计学意义的自变量包括:性别、COPD病史和是否吸烟。

此时,应当考虑应该将哪些自变量纳入Logistic回归模型。一般情况下,建议纳入的变量有:1)单因素分析差异有统计学意义的变量(此时,最好将P值放宽一些,比如0.1或0.15等,避免漏掉一些重要因素);2)单因素分析时,没有发现差异有统计学意义,但是临床上认为与因变量关系密切的自变量。

评论
请先登录后再发表评论
发表评论
medi_28369562201
结果有个块0:起始块,只有常量。还有个块1:方法=前进法(似然法),有相应的参数。选哪个啊。是块1的结果吗。
2023-12-10 10:11:24 回复
0
小喵头
好牛啊
2023-05-17 14:47:06 回复
0
medi_28008493384
很清晰👍
2023-04-03 16:30:40 回复
0
iwannago
好清晰好棒!感恩!
2022-12-03 21:42:07 回复
0
海绵宝宝
好棒
2022-12-02 16:57:07 回复
0
medi_27530643058
我的逐步logistic回归最后只有一个自变量有意义,然后)Hosmer and Lemeshow Test:p为-,那可以吗
2022-10-22 22:51:22 回复
0
medi_26617671675
如果总P值>0.05,哑变量子项存在p<0.05,这个子项算有统计学差异吗?
2022-08-31 16:10:35 回复
2
僧侣
有统计学意义
2023-02-24 08:41:00 回复
0
sxf
混杂因素调整
2022-06-25 12:07:13 回复
0
ywt0614
老师您好,请问为什么如果关注自变量年龄的OR值,就把它转换为分类变量。不理解为什么(年龄每增加1岁,患肺癌的风险增加1.02倍)这种解释在临床上没有意义的?
2022-04-04 23:39:50 回复
0
AXJ
不符合临床实际吧
2022-04-16 10:40:38 回复
0
雨顺
老师,您好!请问将连续自变量按四分位数分成4组(Q1-Q4)后,是将4组全部和其他协变量一起纳入logistic回归分析,并以最低四分位数组(Q1)做参照,得出另外3组的OR与P值,还是以Q1做参照,分别纳入其他的分组,分次得出每组的OR与p值,如一次只纳入Q1与Q2及其他协变量,而不纳入另外两组(Q3、Q4)算出来Q2的OR与p值, 以此类推算其他组的,如Q1遇Q3,Q1与Q4?
2022-04-03 01:14:42 回复
1
  • 1
  • 2
  • 3
  • 4
  • 5
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈