多组必须要做两两比较吗?

专题合集更多教程

内容来自:“小白学统计”微信公众号,感谢作者授权。

 

方差分析中,大家差不多都形成了一种习惯,做组间比较,如果有统计学意义,就考虑做两两比较,看看是不是任意两组之间都有统计学差异。听起来没什么问题,不过需要分一下场合,并不是所有的组间比较都需要做两两比较的。为什么?这就需要从固定效应和随机效应谈起了。

 

可能很多人都听说过固定效应(fixed effect)和随机效应(random effect)这两个名词,应该说,这两个名词在很多地方都有,在实验设计的方差分析中,在混合效应模型中,等等。尽管在不同领域的解释略有不同,但大致差别不大。理解了固定效应和随机效应,你对方差分析模型以及扩展的模型可能会有更深一层的理解。

 

固定效应和随机效应分别是什么

 

什么是固定效应?假定某个处理因素有a个水平(如比较3种药物的疗效,药物是1个因素,3种药物是3个水平),如果研究者的目的很简单,就是想比较3种药物的疗效差异(仅限于这3种药物),不想外推到其它药物。这就是固定效应。

 

什么是随机效应?假定还是1个处理因素a个水平(如比较3种药物的疗效,药物是1个因素,3种药物是3个水平),如果研究者的目的不仅仅是要比较这3种药物的疗效,而是想通过对这3种药物的比较,外推到这3种药物所代表的总体中,这就是随机效应。

 

举个例子,要比较氢氯噻嗪、普萘洛尔、硝苯地平的疗效,如果研究者的目的就是要看氢氯噻嗪、普萘洛尔、硝苯地平这3个药物的疗效差异,这就是固定效应。

 

这3种药物分别是利尿剂、β受体阻滞剂、钙通道阻滞剂,如果研究者的目的不仅仅是看氢氯噻嗪、普萘洛尔、硝苯地平这3个药物的疗效差异,而是为了看这3种药物所代表的利尿剂、β受体阻滞剂、钙通道阻滞剂三种类型药物的差异,这就是随机效应。

 

在固定效应中,研究者目的很明确,就是为了看这固定的3种药物。而在随机效应中,研究者不是为了看这3种药,而是为了看利尿剂、β受体阻滞剂、钙通道阻滞剂这3类药的差异,氢氯噻嗪、普萘洛尔、硝苯地平只是从中随机选择出的一种而已,研究者还可以比较氯噻嗪、美托洛尔、尼群地平这3个药物,也可以作为利尿剂、β受体阻滞剂、钙通道阻滞剂这3类药的代表。

 

再换一个通俗的例子,假如研究者选了北京医科大学和首都医科大学2所学校,比较学校的教学质量。如果研究者的目的就是为了看北医和首医的差异,这就是固定效应。而如果研究者不是为了单纯看这两所学校的差异,而是为了看部属和省属学校的差异,这两所学校只是从部属和省属学校中随机选的而已,这就是随机效应。

 

在固定效应中,研究者就是为了看首医和北医的差异,不想看其它学校。而在随机效应中,研究者要看省属和部属的差异,可以选北医和首医,也可以选北京理工大学和清华大学,这也是省属和部属学校。选择首医和北医,只是一个代表而已。

 

啰里啰嗦一大堆,我想大家应该明白固定效应和随机效应了。可能有人要问了,这跟两两比较有什么关系?别急,下面就谈到这个问题了。

 

和两两比较的关系

 

还是以三种药物的比较为例,

 

固定效应中,它们的假设检验是这样的:

 

H0:μ1= μ2= μ3,即三种药物疗效相同

H1:三个均值不完全相同,或三个均值中至少2个不同

 

在随机效应模型中,它们的假设检验是这样的:

 

H0σ2a=0

H1σ2a>0

其中,σ2a表示出因素a的方差。

 

从这里我们能看出什么呢?很明显,固定效应模型中,比较的就是3个均值的差异大小。而随机效应模型中不是,不是比较3个均值,而是估计因素a造成的变异是不是大于0,所以这种模型有时也称为方差成分模型(variance components model)。

 

为什么随机效应模型不是比较三组均值,而是求方差?很容易理解,可以想一下,三种药物只是代表三类药物而已,事实上,这3类药物有很多种,你是没法逐一比较的。同样, 北医和首医也只是部属和省属的代表而已,你是无法把省属和部属的学校全都比较完的。所以,对于随机效应模型而言,比较组间的均值没有太大意义

 

随机效应模型中,所谓的各组,都只是从它们所代表的总体中随机选择的而已,就像首医和北医,单独比较它们俩是没什么意义的。真正要看的,不是它们俩的均值,而是省属和部属的差值。所以这要用方差来表示。

 

所以,对于固定效应模型,你进行两两比较,没有问题。这本来就是你的目的之一。而对于随机效应,你觉得有必要做两两比较吗?或者说,做两两比较有意义吗?就像刚才说的3种药物,你比较出其中2种药有差异,能说明什么呢?你根本不关注这3种药。

 

其实,换种思路的话,比较均值和比较方差也是一致的。比如:

三个均值μ1、μ2、μ3分别为10、10、10,此时方差为0

三个均值μ1、μ2、μ3分别为10、11、12, 此时方差为1

三个均值μ1、μ2、μ3分别为10、15、20,此时方差为5

 

是不是看出一些端倪了?

 

当你在比较均值的时候,其实跟比较方差是一回事。换句话说,如果三组之间的均值差别比较大,那么它们的方差肯定也很大。如果三组之间差别小,它们的方差肯定也小。

 

如果你善于思考,其实看到这里,应该会想到,t检验和方差分析它们之间到底是什么关系。你仔细看一下它们的公式,是不是有一定关联呢?从更广义的角度来看,其实这些都是一回事。

 

统计学的学习,不要简单地一个一个学习方法,把这些方法割裂开,你最多只能做一个技术员,最多会用软件跑出不同方法的结果,这不是本事。其实所有的这些统计方法都不是孤立的。有时你觉得t检验和方差分析太简单,觉得好像自己都会,但是,你真的“会”吗?

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题