从一项研究说起,聊聊Meta分析的局限性

2021-12-08 来源:医咖会

注:本文来自于《European Heart Journal》(IF=29.983)上针对一项Meta分析的专家述评,探讨了Meta分析的局限性,希望能对大家在解读文献时有所帮助。

接受经皮冠状动脉介入治疗 (PCI)的患者,可能会发生复发性缺血事件。支架技术的进步,例如减少支架厚度,可以帮助减少不良事件。超薄支架(厚度≤70μm)是一种新型支架技术,超薄支架相比第二代药物洗脱支架的临床有效性证据是支持临床实践改变的前提。

2018年,《Circulation》发表了一项纳入10项临床试验的Meta分析(n=11,658)。结果显示,新一代超薄支架与靶病变失败率降低16%相关(RR 0.84; 95% CI, 0.72–0.99),主要由于心肌梗死的减少。靶病变失败定义为1年时心血管死亡、靶血管心肌梗死或血运重建的复合终点。此后,相关试验的随访时间不断延长,并且报告了新的数据。

链接:

https://www.ahajournals.org/doi/10.1161/CIRCULATIONAHA.118.034456

近期,Madhavan等研究者在《European Heart Journal》上发表了一项Meta分析。主要终点为长期的靶病变失败率,即心源性死亡、心肌梗死或靶病变血运重建的复合终点。

 

链接:

https://academic.oup.com/eurheartj/article/42/27/2643/6276781

该Meta分析纳入了16项试验,包含20,701名患者,中位随访时间为2.5年。研究预期结果是超薄支架组的靶病变失败率降低。结果显示,超薄支架组的全因死亡风险在数值上有所增加,但并未达到统计学意义(RR 1.11; 95%CI, 0.98-1.26, P=0.114)

专家述评

这项研究最初是在2021欧洲心血管介入会议(EuroPCR)中的Late Breaking Clinical Trial专场中进行报告。论文初版手稿显示,超薄支架组与全因死亡率增加的相关性具有统计学显著性,这是一个意外的发现,而且难以解释。审稿人在审稿意见中强调有一些新试验未被纳入到分析中,即TALENT和BIOSTEMI试验的2年随访结果

其他局限性还包括:这是研究水平的Meta分析而非患者个体水平的Meta分析,分析中纳入的研究数量不够多,某些试验的随访时间差异较大,无法区分心肌梗死的类型等。这些局限性也符合此类Meta分析预期到的局限性。

作者通过进一步分析回应了审稿人的意见,最终结果在发表的论文中进行了描述。

可以看到,最终分析中全因死亡率的结果发生了变化,即超薄支架组与全因死亡率之间的相关性不再具有统计学显著性。作者解释说,这一结果改变与纳入了TALENT和BIOSTEMI试验的长期随访数据有关,而且只有一部分研究报告了一年之后的死亡数据。

纳入了两项长期随访试验的最终分析显示,超薄支架与全因死亡率之间的相关性不再有统计学意义,RR的95%置信区间(CI)下限为0.98,该结果相对有些薄弱,如果组中再多发生几例死亡事件,也许只需要4例,就可能改变置信区间。

Meta分析的局限性

这个研究案例凸显了Meta分析的一些局限性。

第一,Meta分析的结果取决于纳入的所有研究。试验人员的发表偏倚,Meta分析人员无意中的疏忽,都可能会导致数据的遗漏。

第二,不是参与者个体水平的Meta分析,而是研究水平的Meta分析,依赖各试验报告的结果。

第三,试验的目标可能随着试验的开展发生了变化。在研究设计时主要终点是定义好的,但随访期的延长可能不会预先定义,即使预先定义过,其他因素(如资金问题)也可能影响未来研究的发表。

总而言之,Meta分析的结果是在不断更新的,结论可能会随着时间而发生改变

临床指南将Meta分析视为A级证据。上文提及的Meta分析局限性,应该促使我们思考什么形式或什么标准的Meta分析,可以被接受作为促进A级推荐的证据。

标准可能有哪些呢,例如,作者是否是该领域的专家?是否针对该主题发表过多项Meta分析,如果是,结果是否一致?是否可以进行患者个体水平的Meta分析?是否纳入了所有相关试验?对于特定受试者,临床试验是否完成了预先确定的随访,还是仍在不断变化?

该Meta分析的作者回复

作者认同上述一些观点,即Meta分析的结果是会发生变化的;其有效性取决于纳入的所有相关研究;发表偏倚可能会影响阳性结果。然而,作者不同意述评中对于同行评审过程的描述,即审稿人强调纳入一些新试验数据,这看起来就是作者的失误。

研究最初提交时,BIOSTEMI试验的2年随访数据尚未发布,当时没有任何审稿人建议将其纳入分析。最新的系统搜索时发现了BIOSTEMI试验的2年随访数据,因此文章修订时添加了最新数据。

TALENT试验的2年随访数据在同行评审中虽被提及,但在当时仅有摘要发表,仅包括两个研究终点。因此,大多数分析都依赖于1年的随访数据。当TALENT试验的2年随访结果发布时,作者也相应更新了分析。

在论文提交的不同时间点,全因死亡率的统计学显著性发生了变化,RR从1.14(95% CI, 1.01–1.30, P=0.034)变为1.11(95% CI, 0.98–1.16, P=0.11),这强调了解释结果时要谨慎。如果根据P值0.05进行二元解释,即是或否达到了统计学显著性,可能会丢失很多重要信息,如点估计值、95%置信区间(CI)、统计学异质性等。

一个合理的解释是,这些效应值相似,置信区间是重叠的,因此应避免单纯基于P值对死亡率下确切结论。论文中也指出,“让P值变为有统计学显著性,所需的事件数量可能只需要4例,因此需要对现有试验和其他随机试验进行长期随访”。尽管样本量达到了20701,但对死亡等终点的效能仍不足。

(原文为:… the number of events required to shift the P-value to beyond the threshold for statistical significance is estimated to possibly only be 4;Longer-term follow-up from the present trials, and ideally additional randomized studies are necessary to clarify this uncertainty)

参考文献:

Eur Heart J. 2021 Jul 15;42(27):2655-2656.

Eur Heart J. 2021 Nov 2;ehab681.

评论
请先登录后再发表评论
发表评论
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可享受以下权益
基础课程券2张
200积分
确认
取消
APP下载 领课程券
扫码下载APP
领基础课程券
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈