如何联合多个指标提升诊断准确度?教程来了!

专题合集更多教程

医咖会曾发过一篇文章:《多项测量指标的ROC曲线分析》,详细介绍了结合多项指标进行疾病诊断的统计方法及其SPSS操作。

 

但是文中给出的例子,并没有包含任何诊断试验结果,而是仅利用患者特征(性别、年龄、BMI、COPD病史和是否吸烟),来预测患者是否患肺癌。从严格意义上讲,这并不是一篇标准的联合诊断试验研究,而是一篇建立预测模型的研究。

 

本文将以在体外人工受孕(IVF)中,三种卵巢储备功能检测(ovarian reserve tests)用于预测卵巢低反应(poor ovarian response)作为例子,讲解如何评价多个诊断试验联合的诊断准确性

 

研究问题与数据

 

基础窦卵泡数(AFC),抗缪勒管激素(AMH),促卵泡激素(FSH)是最常用的预测试管婴儿取卵数和卵巢反应的三种卵巢储备功能检测。研究者收集了1023例接受体外人工受孕的患者,用来研究这三种指标用来预测卵巢低反应的准确性。

 

数据分析前的准备

 

在开始分析之前,我们需要对数据进行描述,来了解我们需要分析的数据是什么样子的,也让读者对研究所用的数据有一个直观的印象,这就是表1:患者一般特征的描述统计。

从表中我们可以看出,相比于非卵巢低反应组,卵巢低反应组中AFC和AMH指标较低,而FSH指标较高,同时,卵巢低反应组年龄较高。

 

现在我们对数据已经有了大概的了解,也知道了各个测试指标与是否出现卵巢低反应的关系(即我们通常所说的,这个指标是越高越好还是越低越好)。我们甚至可以通过统计检验,对测试指标进行组间比较,但是这些并不是诊断试验类研究关注的指标。

 

绘制单个指标的ROC曲线

 

对于连续型诊断指标,通常会使用ROC曲线来表现诊断准确度。首先,我们来绘制每一个单独测试指标的ROC曲线,并计算AUC(结果见图1)。单个指标的分析,不是本文的重点,具体操作可以参考医咖会之前的文章:《绘制ROC曲线、找截断值,教你两种软件操作方法!

图1 各种诊断试验的ROC曲线

多个诊断指标的联合

 

完成了上面一波常规操作,我们终于来到了本文的重点:如何联合多个诊断指标。

 

对于联合诊断,二分类诊断结果多采用串联和并联策略;然而,对于连续型的诊断指标,我们通常会利用多个诊断指标的线性组合作为一个新的指标,再用这个新的指标作为诊断依据。

 

那么,如何得到这个线性组合呢?因为我们想要诊断的结局变量是二分类变量,所以这里要利用Logistic回归

 

当我们提到Logistic回归的时候,首先会想到OR值,这是一般情况下我们需要关注的结果。但是当利用Logistic回归来联合多种诊断方法时,我们要用到的是Beta系数(Beta系数进行指数变换以后,就是我们熟悉的OR了。OR=exp(Beta),Beta=log(OR))

 

表2中给出了AFC+AMH+FSH联合诊断方程的系数 (具体操作可以参考本文开头提到的《多项测量指标的ROC曲线分析》一文),我们可以根据这些系数,来计算联合诊断指标得分:

 

新建立的联合诊断得分 = -0.171 - 0.136*AFC -0.319*AMH +0.124*FSH

联合诊断得分计算完成后,我们就可以把它当做是一个单独的指标,像其他诊断指标一样,重复前面对于单个诊断试验的分析了,结果见表3和图1。

图1 各种诊断试验和联合诊断的ROC曲线

 

 我们还可以考虑加入患者特征,作为检测指标的补充。我们知道年龄也是影响卵巢反应的重要因素,甚至仅凭年龄,就能做出比较准确的预测。加入年龄的模型的ROC和AUC,也可以和其他结果一起放入图表中(见上表2,表3,图1)。

 

从图1和表3中,可以看出,相比于单个诊断指标,联合多个指标组成的诊断评分有更高的诊断准确度。

看到这张表3,阅读量比较大的小伙伴可能会有这样的疑问:“我看到很多诊断试验的ROC分析,在给出AUC值的同时,也会报告OR值,我们也要这么做吗?

 

这时候,我们前面制作的表1的作用就体现出来了:我们可以看到不同的检测,单位差别很大,如果此处汇报非标准化的OR值,不同的检测之间没有可比性,如果比较OR值的大小会对读者产生误导,所以这里不建议报告OR值

 

如果小伙伴们觉得以上的分析太少了,文章显得不够充实,想要把这三种检测进行两两组合(A+B, B+C, A+C),求出对应的ROC曲线和AUC。但是这样的分析并不会为文章增加价值,而且加入了这些组合后,在同一张图中多了3条额外的ROC曲线,会让图显得凌乱且难以分辨。

 

所以,作者不建议为了多做分析而做分析,我们只做有意义的分析,比如比较三种指标的联合诊断与单一指标的准确度(AUC)的差异。具体操作可以参考医咖会的文章:《Stata教程:ROC曲线下面积的比较》。

 

结语

 

通常来说,做到这里,一篇完整的多个诊断试验联合的研究的统计分析部分就做好了。我们也可以把这个联合了多个诊断试验的诊断评分,认为是一个简单的预测模型。关于更为复杂的预测模型,我们会在后面关于预测模型的文章中再详细讲解。

 

但是,如果只做如此普通的统计分析,那和咸鱼有什么区别?如何才能让编辑眼前一亮,让评审自愧弗如呢?请听下回分解:协变量调整后的ROC曲线及协变量调整AUC

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题