常见文献中写到“自变量每增加10个单位或每增加一个标准差,...”,这该怎么实现呢?

龚志忠

龚志忠

首都医科大学附属北京中医医院

擅长:临床研究数据统计分析、流行病学方法设计、临床预测模型建模与评价
已关注
关注
2020-07-20 来源:医咖会

在医咖会既往推送的内容《想将连续变量转化为哑变量纳入回归模型,咋分组?》中,我们向大家介绍了在回归模型中引入连续型变量时,除了以其原始变量的形式纳入到模型中外,有时还需要考虑到实际的分析需求,将其按照一定的分组切点转换为哑变量,例如二分类分组、等分位分组、等距分组、临床界值分组,或者按照自己的“Free Style”进行分组等多种转换形式。

但是在介绍以上的转换形式时,我们主要针对的是将连续型变量转化为分类变量,以哑变量的形式引入模型。

而作为连续型变量,本身就自带七十二变的属性,因此本期内容我们继续来向大家介绍一下,在构建回归模型时,连续型变量还有哪些其他神奇的变化形式

首先要提到的就是较为常见的正态转换形式。我们都知道,在构建线性回归时,需要满足一定的前提条件,其中有一项即要求变量需服从正态分布或者近似正态分布,如果不满足正态分布的条件,往往会导致构建的回归模型产生一定的偏倚,因此对于连续型变量在事前进行正态性检验是十分必要的。

医咖会在既往推送的文章《判断数据正态分布的超多方法》中,介绍了多种正态性检验的方法,包括利用数据分布的参数(偏度值、峰度值)进行判断,利用数据分布的图形(直方图,P-P图,Q-Q图)进行判断,或者借助非参数检验的方法(Shapiro-Wilk检验,Kolmogorov-Smirnov检验)来帮助判断。需要复习的同学可以戳上文链接。

那么,当我们的数据资料分布呈现非正态时,需要怎么办呢?此时,我们可以将原始的连续型变量作某种函数的转换,使偏态资料正态化,从而满足回归模型构建的需要。

根据数据本身分布形态的不同,我们可以采用不同的正态转换函数,例如对原始连续型变量开平方取根号值(Square Root)、取自然对数(Ln X)、取以10为底的对数(Log10 X)、取倒数(1 / X)等等,具体的操作方法详见医咖会前期推送的文章《正态转换的多种方法》。

评论
请先登录后再发表评论
发表评论
medi_27195134336
您好,想问一下,方法1将变量 进行标准化处理,是用的z-score法么?还有就是我有看到文献写的是per 1-SD increment的hr变化,想问一下这个也是增加一个sd对因变量的影响么?
2022-01-19 00:24:19 回复
0
medi_27788223136
per 1-SD increment 的hr变化其实就是每增加一个SD所引起的hr的变化量,1-SD中间应该是英文单词中的连字符,有形容词的性质,也可以写为one-SD,不是减号(因为我第一眼就理解成了减号),就像one-way 的意思就是“单向的”。另外标准化的应该就是进行Z-score,并且用z-score标准化和直接用自变量除以标准差之后再拟合模型后的参数是一模一样的(我用数据反复验证后确实得到了这样的事实)。
2023-09-13 09:56:47 回复
0
medi_27788223136
回复 medi_27788223136 : "另外标准化的应该就是进行Z-score,并且用z-score标准化和直接用自变量除以标准差之后再拟合模型后的参数是一模一样的(我用数据反复验证后确实得到了这样的事实)"仅限于logistic回归验证
2023-09-13 10:16:54 回复
0
medi_27195134336
讲的太好了,真是解决再阅读统计文章时很大的疑惑
2022-01-18 22:52:01 回复
0
使用课程券需先认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可免费享受基础会员权益
基础课程券2张
专属科研工作台
200积分
确认
取消
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈