一张图搞明白分类资料的组间比较方法

专题合集更多教程

内容来自:“小白学统计”微信公众号,感谢作者授权。

 

分类资料的组间比较非常简单,不像定量资料那样,还得看正态性、方差齐性这么烦人的过程。唯一需要看的就是结局是什么样子。所以,如果说定量资料你能用错,你还可以说,你不会做正态性检验、不会方差齐性检验。那么如果分类资料的组间比较你用错的,真的没有什么理由可以找,所以你真的没有任何犯错的理由。

 

分类资料就是那些可以划分类别的数据,两类和多类均可,只不过需要注意一下多类别的时候可能是有序的,也可能是无序的。无序的就是没有什么等级高低顺序,就像血型,没有什么理由认为A比B要高一等或低一等。有序就是能看出一种天然的顺序,就像疗效,无效、显效、痊愈,给人感觉痊愈就是比显效高一等。

 

有一种情形要注意,不是看到率或百分比就要认为是分类资料,就要用卡方检验的。有的率是作为连续资料来分析的

 

比如脂肪百分比,虽然也是个比例,但你没法用卡方检验。因为这个百分比是每个人都有一个这样的数值,你能做的是把每个人的百分比作为一个定量资料,然后进行组间比较。

 

以前就有人真的这么问过我说:这不是比例吗?比例不是都得用卡方吗?我想这种观念很可能是老师在教学的时候习惯把比例和率跟卡方联系起来,事实上未必,其实用“分类资料”这样的字眼更好一些。

 

分类资料的比例,说的是一定的数量占所有人的百分比,具体到每个人来说,他只有0或1这样的数值(多分类也可能是0、1、2等),计算的比例是0或1占的比例。而刚才这种情形是每个人都有一个具体的不同数值,这是完全不同的。

 

对于分类资料的组间比较,可以通过下面这样一张图来选择方法

 

 

从这个图不难看出,分类资料的组间比较只需要注意三点就可以

 

(1)设计类型。这个你自己是很清楚的。大多数情况下,可能我们做的都是基于完全随机设计的。对于没有设计的,如比较男女之间的发病率,男女分组不是随机设计的,那也采用完全随机设计的方法来分析。

 

(2)组别数,从小学一年级就应该能数的很清楚了。

 

(3)重要的是结局的类型,是二分类还是多分类,多分类是有序的还是无序的。

 

从图中不难看出,最重要的是你的结局的类型,对于完全随机设计,只要你的结局是二分类和无序多分类,不管是比较2组还是多组,都可以毫不犹豫地选择卡方检验。但如果是有序多分类,那就需要根据是2组还是多组,选择相应的方法。

 

其实,对于定量资料的组间比较和分类资料的组间比较,我想表达的并不仅仅是画图让大家照着来找分析方法,更重要的是,学会一种分析思路。如果看一下统计学教材,不难看出教材的特点,大都是以不同方法作为章节区分的依据,比如第二章讲t检验,第三章讲卡方检验,等等。作为教材的编纂,这无可厚非,但作为老师讲课,却不一定非要严格按照这种方式来讲。

 

为什么国内好多学生,学了1年的统计,真正碰到数据的时候,却总是束手无策,甚至连最基本的分析思路都不知道,空学了一肚子的t检验和卡方检验,却不知道从哪儿下手。我想,也许是因为教材的教授方式跟我们实际分析的思路恰好相反。实际分析数据时,你收集了一批数据,然后需要根据数据的类型、特征、分布等选择恰当的方法;而教材中,是把各种方法割裂开,讲各种方法的使用条件。

 

那么,当你面对一堆数据的时候,你是把你脑子中的各种方法逐一来匹配一下吗?每个方法都来试试,看看哪个符合应用条件?还是根据数据类型、特征来选择合适的方法呢?我想可能根据数据的条件来选择方法更加自然一些,这是一种分析思路。而用方法来套数据这不是分析思路。也许,这就是为什么你学了这么久统计,却始终还不了解分析思路的原因。

 

所以,其实对于定量资料和分类资料,更重要的是学会分析思路,不要用方法去套数据,而要根据数据来选方法。久而久之,才会形成自己的分析体系。

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题