简单线性回归

SPSS教程回归分析
问答

点击绿色“提问”按钮

  • 针对本文提问
  • 查看历史问答

长按鼠标选中正文某句话

  • 对选中的内容进行针对性提问
一、问题与数据

某研究者猜测,45岁至65岁健康男性中,久坐时间较长者,血液中的胆固醇浓度要高一些。因此拟开展一项研究探讨胆固醇浓度与久坐时间是否有关,并希望通过久坐时间预测胆固醇浓度。研究者收集了研究对象每天久坐时间(变量time)和胆固醇浓度(变量cholesterol)。部分数据如图1。

 

图1 部分数据

二、对问题分析

研究者想判断两个变量之间的关系,同时用其中一个变量(久坐时间)预测另一个变量(胆固醇浓度),计算其中一个变量(久坐时间)对另一个变量(胆固醇浓度)变异的解释程度。针对这种情况,可以使用简单线性回归分析,但需要考虑7个假设。


假设1:因变量是连续变量。


假设2:自变量可以被定义为连续变量。


假设3:因变量和自变量之间存在线性关系。


假设4:各观测值之间相互独立,即残差之间不存在自相关。


假设5:因变量没有显著异常值。


假设6:残差的方差齐。


假设7:残差近似正态分布。


假设1和假设2与研究设计有关。经分析,本研究数据符合假设1和2。如何考虑和处理假设3-7呢?

三、SPSS操作
请先登录
这么重要的内容,赶快登录查看吧!
四、结果解释
请先登录
这么重要的内容,赶快登录查看吧!
五、撰写结论

采用简单线性回归模型分析久坐时间对胆固醇浓度的影响。通过绘制散点图,直观判断两者之间存在线性关系,并通过绘制标准化残差散点图和带正态曲线的直方图和P-P图,判断残差方差齐且近似正态分布。同时为了保证数据的代表性,我们剔除了一项异常值(胆固醇浓度为6.94mmol/L)。


回归方程为:胆固醇浓度= 3.64856+(0.00632×久坐时间)。久坐时间对胆固醇浓度的影响有统计学意义,F=161.926,P <0.001;久坐时间可以解释胆固醇浓度变异的62.5%,影响程度中等(调整R2= 62.2%)。久坐时间每增加1分钟/天,胆固醇浓度增加0.00632 (95% CI:0.00533-0.00731)mmol/L。此外,久坐时间为160分钟/天、170分钟/天和180分钟/天的胆固醇浓度预测值分别为4.660 (95% CI:4.517-4.802)mmol/L、4.723 (95% CI:4.589-4.857)mmol/L和4.786 (95% CI:4.661-4.91)mmol/L。

六、绘制图表

3.1部分中,已经绘制出了基本的散点图,但是在汇报结果时,有时仍需要增加最佳拟合线、平均值的95%CI与个体值的95%CI等指标。具体操作方法如下:


双击散点图,激活Chart Editor,点击Element→ Fit Line at Total,如图25。

 

图25 Chart Editor


此时,散点图上出现拟合直线及回归方程。同时,Properties对话框也会自动弹出。如图26、图27。

 

图26 出现拟合直线及回归方程

 

图27 Properties


提示:如果只想做出最佳拟合线,到这一步就可以关闭Properties和Chart Editor窗口,完成操作。如果需要绘制平均值的95%CI与个体值的95%CI,请继续操作。


在Properties对话框中,点击Confidence Intervals中的Mean,如图28。

 

图28 绘制平均值的95%CI


点击Apply,出现图29。

 

图29平均值的95%CI


同样在Properties对话框中,点击Confidence Intervals中的Individual,点击Apply,则出现个体值的95%CI,如图30。

 

图30 绘制个体值的95%CI

 

关闭Properties和Chart Editor窗口,Output Viewer窗口会弹出带有平均值95%CI和个体值95%CI的散点图,如图31。

 

图31 有平均值95%CI和个体值95%CI的散点图

请先登录
这么重要的内容,赶快登录查看吧!
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
Next
Previous
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题