讲诊断试验前,我们先得了解人体生物指标的分布
李侗桐

李侗桐

北京大学

擅长:卫生统计学、定性分析方法、卫生经济学、全球卫生政策分析
已关注
关注
2018-01-13 来源:医咖会

无论是医生还是患者都会接触很多诊断试验,比如胸片、心电图、血常规、B超以及CT等等。然而,很多诊断并不是100%正确的,有时候会有假阴性,有时候会有假阳性。那么,为什么一个医学诊断不能做到100%的正确呢?

我们先来看看人体生物指标的分布情况。

一、人体生物指标——双峰分布

以结核菌素试验(PPD试验)为例,结核菌素在皮内注射后,硬结直径在人群中的分布情况如图1:

可以看出,结核菌素试验后,硬结直径主要集中在0mm和20mm两个区域,呈现两个高峰(即双峰分布)。没有感染过结核杆菌的人集中上图的左侧(没有硬结或很小),感染过结核杆菌的人集中在上图的右侧(出现20mm左右的硬结)。

当然,也有一些人的硬结直径可能落入“灰色地带”(上图中间区域),不容易诊断是否有过结核杆菌感染。但是,一个诊断如果依据的是这样的双峰分布,仍然比较容易区分大部分人的情况,判断病人和非病人。

二、人体生物指标——单峰分布

男性收缩压的分布情况如图2。可见,收缩压的分布只有一个峰值,属于单峰分布。

在这种情况下,如果想通过一个诊断来区分高血压患者和非高血压患者,我们就必须设置一个截点(cutoff)。血压值高于此截点认为是高血压人群,低于此截点认为是非高血压人群。

然而,对于这样一个连续的、呈单峰分布的血压值,截点选择在什么位置才更合适呢?理想的截点是,收缩压超过这个截点,相比低于这个截点的人,在中风、动脉硬化以及死亡等方面有更高的风险。这样我们的诊断试验和结果才更有意义。

实际上,人体大多数的生物指标都呈现单峰分布。因此,我们需要通过一定的统计手段,选择截点的位置,同时希望截点具有一定生物学意义。但无论怎样,选择一个截点,必然会有一部分收缩压大于这个截点的人,中风、动脉硬化以及死亡等方面风险并不高(假阳性);但另一部分收缩压小于这个截点的人,中风、动脉硬化以及死亡等方面风险很高(假阴性)。这就是为什么一个医学诊断不能做到100%的正确的原因(图3)。

有问题
找小咖
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
数据库搭建
想提升科研效率和数据质量?扫码添加小E,立即咨询数据采集与管理相关产品和服务!查看详细>>
意见反馈