一、问题与数据
最大携氧能力(maximal aerobic capacity,VO2 max)是评价人体健康的关键指标,但测量方法复杂,不易实现。具体原因在于,它不仅需要昂贵的试验设备,还需要研究对象运动到个人承受能力的极限,无法测量那些没有运动意愿或患有高危疾病无法运动的研究对象。因此,某研究者拟通过一些方便、易得的指标建立研究对象最大携氧能力的预测模型。该研究者共招募100位研究对象,分别测量他们的最大携氧能力(VO2 max),并收集年龄(age)、体重(weight)、运动后心率(heart_rate)和性别(gender)等变量信息。部分数据图1。
图1 部分数据
二、对问题分析
研究者想根据一些变量(age、weight、heart_rate和gender)预测另一个变量(VO2 max)。针对这种情况,可以使用多重线性回归分析,但需要先满足以下8项假设:
假设1:因变量是连续变量。
假设2:自变量不少于2个(连续变量或分类变量都可以)。
假设3:各观测值之间相互独立,即残差之间不存在自相关。
假设4:因变量和自变量之间存在线性关系。
假设5:残差的方差齐。
假设6:不存在多重共线性。
假设7:没有显著异常值。
假设8:残差近似正态分布。
假设1和假设2与研究设计有关。本研究数据符合假设1和2。如何考虑假设3-8呢?
三、SPSS操作

四、结果解释

五、撰写结论
本研究采用多重线性回归,根据性别、年龄、体重和心率预测最大携氧能力。通过绘制部分回归散点图和学生化残差与预测值的散点图,判断自变量和因变量之间存在线性关系。已验证研究观测值之间相互独立(Durbin-Watson检验值为2.257);并通过绘制学生化残差与未标化的预测值之间的散点图,证实残差的方差齐。回归容忍度均大于0.1,不存在多重共线性。异常值检验中,不存在学生化删除残差大于3倍标准差的观测值,数据杠杆值均小于0.2,也没有Cook距离大于1的数值。P-P图提示,残差近似正态分布。回归模型具有统计学意义,F= 23.223,P<0.001,调整R2=0.703。纳入模型的4个自变量对最大携氧能力的影响均有统计学意义(P<0.05),具体结果见表1。
表1 多重线性回归结果
六、更多阅读
-
【SPSS教程】广义估计方程(GEE)
在临床研究中,经常会比较两种治疗方式对患者结局的影响,并且多次测量结局。例如,为了研究两种降压药物对血压的控制效果是否存在差异,研究者会对两个人群服药后在不同时间点记录血压值,然后评价降压效果。或者对两组动物分别施加两种干预,连续记录多个时间点的结局,然后比较两种干预的效果。
-
【SPSS教程】分层回归
研究者已知某些自变量(age和gender)与因变量(VO2 max)有关,拟判断逐个增加自变量(weight和heart_rate)后对因变量预测模型的改变。针对这种情况,我们可以使用分层回归分析,但需要先满足8项假设。
-
【SPSS教程】加权最小二乘法
多重线性回归,残差不满足方差齐性怎么办?我们可以采用加权最小二乘法(WLS)的方法来进行模型估计,即在模型拟合时,根据数据变异程度的大小赋予不同的权重
-
【SPSS教程】岭回归
岭回归(Ridge Regression)在1962年首次提出,是采用改进的普通最小二乘法,用于处理自变量多重共线性问题的一种有偏估计回归方法。
