详细教程:基于Logistic回归模型构建疾病风险评分工具

龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2018-11-20 来源:医咖会

 我们在前期介绍Framingham Heart Study的文章中《历经70年,发文3000多篇,致敬如此伟大的研究!》,提到Framingham Heart Study在探讨疾病危险因素和构建风险预测模型方面,做出了很大的贡献。

其中1998年Framingham Heart Study发表了一个经典的冠心病10年风险预测评分工具,该风险函数成为美国国家胆固醇教育计划(NCEP)成人治疗方案(Adult Treatment Panel,ATP)计算冠心病风险的基础。

该模型不再使用原有的连续变量形式,而是将危险因素进行分层,对每一分层进行量化赋分,最后通过计算总分来对患者进行疾病风险评估,评分工具不仅有助于患者理解,也能够在临床中得到较好的推广应用。

如果说只是单纯的构建疾病风险预测模型,相信大家应该都比较熟悉,至少大家也都用过Logistic回归、Cox回归等这些常用的回归模型。但是如何将自己构建的预测模型转化为风险评分工具,似乎成了一个难题。

今天小咖就以多因素Logistic回归模型为例,给大家逐步解密,教会大家也能做出这种高大上的疾病评分工具。

研究实例

我们仍以Framingham Heart Study为例来进行说明,研究共纳入9443名健康人群,年龄为30-79岁,对研究对象随访5年,观察他们冠心病硬终点的发病情况,包括心肌梗死、死亡。

假定我们要考虑的主要危险因素包括:年龄、性别、收缩压、吸烟,研究人群各个危险因素的分布情况如下表所示,我们在此研究的基础上来制作疾病风险评分工具。

步骤

1. 构建多因素Logistic回归模型

通过构建多因素Logistic回归模型,将我们主要考虑的危险因素纳入到回归模型中,从而估计各个危险因素的回归系数β,OR值及其95% CI,回归结果如下表所示。

试读结束,兑换后即可解锁本专栏全部课程
评论
请先登录后再发表评论
发表评论
medi_28254369025
“再根据多因素 logistic 回归模型的方程,来计算每一分值对应的风险预测概率值”,请问在这个计算公式里,常数项是怎么确定的?这里指-10.5161这个值
2023-09-22 15:57:44 回复
0
medi_28007484452
强烈希望龚老师提供这篇文章的出处
2023-04-02 23:55:00 回复
0
medi_27969147125
这个常数B是每个危险因素都不一样吗
2023-03-07 21:33:04 回复
0
medi_28254369025
应该是不一样的吧,看它的计算公式是 B = a * \beta_i,这里a是认为假设的,含义是a增加多少对应风险评分增加1分。\beta_i 是根据 Logistic 回归得到的回归系数,所以每个危险因素应该对应不同的常数 B。
2023-09-22 15:39:27 回复
0
medi_27725095460
根据列线图赋分
2022-12-11 21:55:21 回复
0
medi_27462756126
请问得出赋值以后这个结局可以风险分层吗?比如 多少分-多少分 低危,然后中危 高危 。或者概率大于多少就中危 高危这样
2022-05-18 00:12:11 回复
0
medi_27416653313
如果都是二分类的数据,那么等于1分的常数B怎么设定
2022-02-27 00:35:08 回复
0
medi_27454047971
请问这个问题解决了吗?我看文中就是利用年龄那个常数,不知道其他文中是否就是用这个
2022-03-14 16:01:59 回复
0
medi_27438841250
回复 medi_27454047971 : 跟一个统计学专业的朋友进行讨论后认为根据回归系数的公约数(大致)进行设定。不过我最后学了R建立列线图了
2022-04-05 01:33:46 回复
0
哈哈哈
可以出一个详细的视频讲解吗?谢谢呀
2021-09-26 11:16:47 回复
0
小宝宝
有没有参考文献啊,很想用这个方法。
2021-09-14 10:43:11 回复
0
豆包
可以看看: Bostom A G , Silbershatz H , Jacques P F , et al. Serum total homocysteine levels predict all cause and cardiovascular disease mortality in elderly Framingham men and women[J]. Circulation, 1998, 97(8):818-818.
2021-09-27 15:27:33 回复
0
medi_26755443959
回复 豆包 : 应该是这篇文章:Prediction of Coronary Heart Disease Using Risk Factor Categories
2022-01-13 19:31:03 回复
0
medi_28007484452
回复 medi_26755443959 : 不是这篇
2023-04-02 23:54:15 回复
0
sugar
请问有数据和详细的操作教程吗?
2021-06-08 20:21:33 回复
0
豆包
数据可以看看文献:[1] Bostom A G , Silbershatz H , Jacques P F , et al. Serum total homocysteine levels predict all cause and cardiovascular disease mortality in elderly Framingham men and women[J]. Circulation, 1998, 97(8):818-818. 操作可以看看上文的教程
2021-09-27 15:27:54 回复
0
开心伢子
请问logistic回归得出OR<1的保护因素可以纳入吗?如何操作?谢谢
2021-05-26 21:05:59 回复
0
豆包
可以纳入,可以看看:我该咋筛选变量进入多因素回归?先教你基础几招! https://www.mediecogroup.com/zhuanlan/lessons/249/
2021-09-27 15:28:37 回复
0
  • 1
  • 2
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈