一张图搞明白分类资料的组间比较方法

2019-07-02 来源：“小白学统计”微信公众号

分类资料的组间比较非常简单，不像定量资料那样，还得看正态性、方差齐性这么烦人的过程。唯一需要看的就是结局是什么样子。所以，如果说定量资料你能用错，你还可以说，你不会做正态性检验、不会方差齐性检验。那么如果分类资料的组间比较你用错的，真的没有什么理由可以找，所以你真的没有任何犯错的理由。

分类资料就是那些可以划分类别的数据，两类和多类均可，只不过需要注意一下多类别的时候可能是有序的，也可能是无序的。无序的就是没有什么等级高低顺序，就像血型，没有什么理由认为A比B要高一等或低一等。有序就是能看出一种天然的顺序，就像疗效，无效、显效、痊愈，给人感觉痊愈就是比显效高一等。

有一种情形要注意，不是看到率或百分比就要认为是分类资料，就要用卡方检验的。有的率是作为连续资料来分析的。

比如脂肪百分比，虽然也是个比例，但你没法用卡方检验。因为这个百分比是每个人都有一个这样的数值，你能做的是把每个人的百分比作为一个定量资料，然后进行组间比较。

以前就有人真的这么问过我说：这不是比例吗？比例不是都得用卡方吗？我想这种观念很可能是老师在教学的时候习惯把比例和率跟卡方联系起来，事实上未必，其实用“分类资料”这样的字眼更好一些。

分类资料的比例，说的是一定的数量占所有人的百分比，具体到每个人来说，他只有0或1这样的数值（多分类也可能是0、1、2等），计算的比例是0或1占的比例。而刚才这种情形是每个人都有一个具体的不同数值，这是完全不同的。

对于分类资料的组间比较，可以通过下面这样一张图来选择方法：

从这个图不难看出，分类资料的组间比较只需要注意三点就可以：

（1）设计类型。这个你自己是很清楚的。大多数情况下，可能我们做的都是基于完全随机设计的。对于没有设计的，如比较男女之间的发病率，男女分组不是随机设计的，那也采用完全随机设计的方法来分析。

（2）组别数，从小学一年级就应该能数的很清楚了。

（3）重要的是结局的类型，是二分类还是多分类，多分类是有序的还是无序的。

从图中不难看出，最重要的是你的结局的类型，对于完全随机设计，只要你的结局是二分类和无序多分类，不管是比较2组还是多组，都可以毫不犹豫地选择卡方检验。但如果是有序多分类，那就需要根据是2组还是多组，选择相应的方法。

请先登录后再发表评论

发表评论

推荐课程

确认

取消

确认

取消

公众号

统计咨询

扫一扫添加小咖个人微信，立即咨询统计分析服务！

确认删除