P<0.05就是强有力的证据吗?
张耀文

张耀文

医咖会

擅长:研究设计、统计分析、循证医学、样本量计算、随机化方案、数据管理
已关注
关注
2017-09-27 来源:医咖会

新英格兰医学杂志刊出的一篇综述《The Primary Outcome Is Positive — Is That Good Enough?》中[1],作者认为当临床试验的主要结局阳性时,还应当考虑11个问题。(表1)

表1. 主要结局阳性时应当考虑的问题

我们将分几期讨论这些问题,今天我们先讨论第1个。

一、“P<0.05认为差异有统计学意义”是什么意思?

在看文章、做研究、写文章的过程中,我们经常会看到这样的描述:P<0.05时,认为差异有统计学意义。实际上,这里的“0.05”是研究开始前指定的显著性水平α。那么,“P<0.05时,认为差异有统计学意义”或者“显著性水平α=0.05”到底是什么意思呢?

这里我们先简略解释两个概念。

1、零假设

以比较临床研究中治疗组和对照组用药效果的组间差异为例,判断是否有统计学意义所用的统计思维与中学数学的“反证法”思维类似,即:①假设两组没有差异,②统计检验现有数据,③发现根据现有数据,“假设两组没有差异”这件事情成立的可能性太低,④所以拒绝“假设两组没有差异”,认为“两组之间的差异有统计学意义”。这里的“假设两组没有差异”就是统计分析时的“零假设”。

2、Ⅰ类错误

然而,上述过程中,我们有可能犯错误:即如果“两组没有差异”这件事情是真实的,但是由于各种原因,我们根据现有数据得到的结果可能会发现“两组之间的差异有统计学意义”。这种错误可以类比为实验室检查中的“假阳性”,统计分析时称之为“Ⅰ类错误”,也就是零假设成立时我们错误地拒绝了零假设。

再来回顾前面的问题,大多数研究规定“P<0.05时,认为差异有统计学意义”或者“显著性水平α=0.05”,指的是如果本研究统计推断得到的差异有统计学意义,那么该结果是“假阳性”的概率小于0.05。显然,这个“假阳性”概率越小,我们由样本发现的治疗组和对照组的组间差异,越有可能反应总体的真实情况。