要分析组间的差异,该如何选择正确的统计方法?
李侗桐

李侗桐

北京大学

擅长:卫生统计学、定性分析方法、卫生经济学、全球卫生政策分析
已关注
关注
2019-12-16 来源:医咖会

作者:李侗桐;审稿:张耀文

差异分析主要用于:

(1)判断因变量在两组或多组之间的统计学差异,各组之间可以是独立的,也可以是非独立的;

(2)如果多组之间存在差异,进一步开展两两比较,分析差异来源。

比如,分析不同医疗机构医生收入水平的差异。收入水平是因变量,医疗机构是自变量,自变量可以分为互相独立的3组:基层医院、二级医院和三级医院。再如,判断受试者在运动干预前后的心率是否存在差异。心率是因变量,自变量是时间,可分为干预前和干预后非独立的两组,示例如下:

差异分析的研究设计类型主要分为三种:组间设计、组内设计和混合设计,具体如下:

2.1 组间设计

组间设计是指研究中的各组相互独立,组别互斥,即研究对象只能存在于一组,不能分属于不同组别。

比如,研究不同性别受试者的BMI差异,BMI是因变量,性别是自变量,包含两个相互独立的组别:组1男性和组2女性。在该研究中,组1和组2是互斥的,即某一位受试者只能是男性(组1),或只能是女性(组2),不能既是男性又是女性。

再比如,研究酗酒者和非酗酒者的谷丙转氨酶差异,谷丙转氨酶是因变量,是否酗酒为自变量,包含两个相互独立的组别:组1酗酒和组2不酗酒。同样的道理,受试者只能是酗酒者(组1)或非酗酒者(组2),不能既是酗酒者又不是酗酒者,即组1和组2互斥,相互独立。

组间设计示例如下:

2.2 组内设计

组内设计,又称重复测量设计,是指研究中的各组相互关联,所有研究对象均可分属于不同组别。简单来说,组内设计就是对研究对象进行重复多次测量,或对同一研究对象开展多种干预(常见于交叉设计)。

比如,分析运动前后,受试者心率的变化。心率是因变量,时间是自变量,包含两个相互关联的组别:时间点1(运动前)和时间点2(运动后)。在该研究中,时间点1和时间点2并不互斥,即运动后的研究对象与运动前一样,是同一群受试者接受了两次心率检测,任一位受试者既属于时间点1,又属于时间点2。如果我们针对同一群受试者增加重复测量次数,那么该研究仍是组内设计,研究类型不变。

有问题
找小咖
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
数据库搭建
想提升科研效率和数据质量?扫码添加小E,立即咨询数据采集与管理相关产品和服务!查看详细>>
意见反馈