利用真实世界数据做好研究:聊聊热门的疗效比较研究(CER)

专题合集更多教程

作者:李侗桐

 

2019年1月30日,《Nature Reviews Clinical Oncology》发表了一篇题为《Real-world data: towards achieving the achievable in cancer care》的综述,以肿瘤领域为例,详细介绍了真实世界数据

 

在前面的几篇文章中,我们举例了利用患者、治疗和结局真实世界数据(RWD)的经典研究,介绍了大家关心的数据质量问题。详见:《利用真实世界数据做好研究:关键的数据质量问题》,《利用真实世界数据做研究:可以从哪些方面入手?》。

 

今天这篇文章,我们来讲一讲疗效比较研究(Comparative Effectiveness Research,CER)

 

随机对照试验(RCT)和真实世界数据(RWD)

 

RCT和RWD分别通过不同的研究方法解决不同的研究问题:RCT是探讨患者想要达到的结局,而RWD研究是分析已经出现的结局。对于RCT无法解决的很多问题,可以利用RWD来探索。当使用RWD对两种治疗方案的有效性进行比较时,该研究应该被视为是用来产生假设,但如果研究设计不当,其结果可能对患者有害。

 

RCT的优势在于数据内部有效性较好,但缺点是缺乏外推性,因为受试者的代表性较差。据统计,由于严格的纳入排除标准,能进入临床试验的美国成年癌症患者不超过5%。但是,这也不是说不能提高RCT的外推性。例如,RCT在儿科肿瘤的应用时间较长,约有60%的患儿可以被纳入到RCT中。据此,Peto等认为应该放宽RCT对成年患者的纳入标准。不应该期望RWD研究解决RCT的外推性问题,而应该提高RCT自身的代表性。

 

最后,必须强调,RCT研究和利用RWD(数据源)的研究并不是相互排斥的。虽然我们常常通过RWD研究补充RCT的不足,但人们越来越希望在真实世界中开展RCT,再根据电子病历和注册登记数据对比不同治疗方案的毒性和结局。

 

真实世界的疗效比较研究

 

很多人认为,在真实世界中,对接受了不同治疗方案的非随机分组患者进行结局的比较是有问题的,因为不同组的患者可能在预后因素上本身就存在差异。

 

如今对RWD研究这方面的担忧,就像50年前人们对于使用机构数据(institutional data)来评估治疗效果的担忧一样。人群为基础的研究,其外部一致性比机构为基础的研究好,而后者的内部一致性较好,两者的证据等级都是3级(Sackett证据等级)。

 

RWD观察性研究可以采取以下三种方法减小偏倚:第一,通过多因素分析调整潜在混杂,但该方法只能调整已知且可测量的因素。第二,应用倾向评分法。第三,采用工具变量分析(IVA)。

 

(具体可查看医咖会以前推送的专题:【专题】控制混杂因素,教你4招!这三种方法都有具体文章介绍)

 

我们认为,疗效比较研究也是有层级的。层级顶端的研究,是探索RCT中观察到的efficacy(理论疗效或效力)是否确实能转换成真实世界中的effectiveness(实际疗效或效果)虽然这类研究仍可能出现偏倚,但验证的效应来自证据力度为1级的RCT,这个效应真实存在的可信度很高。举例来说,RCT提示辅助化疗对NSCLC患者有益,利用真实世界研究分析这种治疗的接受度和结局,发现真实世界中的患者也有生存获益。

 

第二种情况,检验非1级证据发现的效应。这种情况一般是为结果提供更多的证据支持。例如,我们曾经做过的膀胱癌辅助化疗研究,为那些表明顺铂治疗有益的一系列小规模RCTs提供了更多支持。

 

第三种情况,RCT未发现治疗有效,且没有其他证据表明有效。在这种情况下,即使观察性研究结果说明治疗有效,考虑到出现I型错误的可能性较高,我们也会对观察性结果提出质疑。

 

基于美国国家癌症数据库(NCDB)的一些研究结果证明了这种现象。举例来说,RCT研究结果认为,针对II期结肠癌患者的辅助化疗作用很小,放疗可以控制局部疾病发展,但对直肠癌的总体生存无影响。

 

与RCT结果不同的是,基于NCDB的两项研究(2016年、2017年)发现低风险II期结肠癌患者接受辅助化疗可以获得显著改善,新辅助放疗也对局部晚期直肠癌有明显益处。观察到的治疗有效性更有可能来自于残余混杂、永恒时间偏倚以及测量误差,而不是这些治疗在真实世界中的疗效真的比RCT中好。

 

疗效比较研究的质量

 

仅依据研究类型来定级证据并不合理,比如,观察性研究的效度可以很大,也可以很小,取决于其研究操作和分析。流行病学家很少进行RCT,他们主要依靠观察性研究,并建立了评价此类数据质量的方法。Sanderson等系统总结了评价观察性研究质量的86种方法[PMID: 17470488]。但Sanderson等并不能确定哪一种方法最好,他们认为评价工具必须包含观察性研究的3个要素:调查对象的选择,暴露和结局的测量,混杂的控制,同时也应该针对研究设计评估其他可能出现的偏倚。

 

虽然Sanderson等总结的方法中有一些计算了总的评价分数,但他们认为这样做是不对的。因为计算总分势必会对研究要素加权,而加权的过程往往不尽合理。因此,Sanderson等认为应该使用一个简明的列表来评估观察性研究,尤其是那些可以影响研究结果的、潜在的关键性偏倚。

 

Sanderson等总结的方法也可以用于评估队列研究质量。基于评价非随机研究质量的纽卡斯尔-渥太华量表,我们建立了针对肿瘤人群结局研究的评价框架(框2)。该框架不计算总分,是对癌症注册登记数据结局研究的定性评估,也符合Sanderson等对评估工具的基本要求:(1)只包含关键要素;(2)在考虑到研究设计和主题的情况下,尽量具体;(3)以列表而不是量表的形式展现;(4)严谨,并体现有效性和可靠性。我们会在本文中讨论前三项要求。

 

  

为避免人群研究设计带来的偏倚,应尽可能遵循临床试验的逻辑进行统计分析。在人群结局研究中,研究者通常可以同时获得研究对象、治疗分组以及结局数据。那么,分析时必须按照时间逻辑进行,即治疗分组不能影响研究对象的纳入,患者结局也不能影响治疗分组。因此,必须在治疗分组之前确定纳入标准,并且在评估结局之前确定治疗分组

 

这听起来容易,但实际上很难,假设我们以癌症分期作为一项纳入标准,那么治疗分组就很可能会影响研究对象的纳入。这个问题在于患者注册登记只能记录癌症患者的部分数据,如记录手术患者的手术和临床信息,非手术患者的临床信息。在这种情况下,手术患者的信息比较全面,而非手术患者就相应的缺少很多信息,从而不能比较两种患者之间的治疗结局差异。某些注册登记数据也会在治疗开始后更新患者的癌症分期,如依据术后分期骨扫描结果更新数据。

 

如果我们事先意识到可能存在的问题,那么患者结局对治疗分组的影响就比较容易解决。假设一项研究的主要结局是存活,以患者是否在确诊后3个月内完成治疗为依据进行治疗分组,如果患者在确诊后3个月内死亡,就被自动分到了对照组。那么在这项研究中,研究者以患者的确诊时间作为存活的开始计算时间,就会低估对照组的存活结局。这是永恒时间偏倚的典型例子,因为干预组患者在治疗开始之前都没有死亡,而对照组患者在确诊后就可能已经出现了死亡。

 

RCT研究通过意向性分析来避免这个问题,但这对观察性研究并不适用。因为在观察性研究中患者的治疗意向是未知的,只有当患者接受了治疗之后才能进行治疗分组。针对上面这个研究的问题,我们可以简单地排除早期死亡患者,以确诊后3个月为结局测量的开始时间。 

 

在评价观察性研究提示的治疗效果时,研究者可以借鉴流行病学领域评价暴露-疾病的方法。在使用RWD的研究中,Bradford Hill的评估因果关联框架[PMID: 14283879]可以用于指导治疗效果的评估。

 

这套因果评价体系可以用于评价总体证据力度、关联强度及不同研究的一致性(关联强度和一致性越好,提示关联存在的概率越大);是否存在剂量反应关系;与预期结局相关而不是与其他结局相关的特异性暴露或治疗;以及该治疗效果的合理性和理论基础。

 

当然,进行因果分析时并不一定要知道治疗效果出现的理论机制,但如果了解了其理论基础就可以增加研究者对结果的信心。基于Hill的评价体系,我们为评估人群研究结果设置了一些条目,帮助对比不同治疗方案的疗效(框2)。

 

RWD在监管方面的应用

 

RWD正越来越多地应用于药物审批和基金资助决策。当然,药物审批肯定不仅仅依据RWD,目前许多国家是在监管审批时将RWD作为临床试验的补充。依据二十一世纪治疗法(21st Century Cures Act)的要求,FDA应进一步制定RWD在药物审批中的应用指南。

 

医疗服务的成本效益逐渐受到人们重视,也因此激发了研究者对RWD支撑医保决策的关注。管理者在开展卫生技术评估(Health Technology Assessment,HTA)时需要使用RWD,以寻找证据证明临床干预在改善生存、提高生活质量以及降低成本方面的有效性。同时,RWD也可以指导药物报销,帮助制定医保支付政策并进行药物经济学分析。

 

在开始进行HTA时,研究者通常对干预的疗效提出问题,如在III期临床试验中发现的efficacy(效力)是否能转换成真实世界中的effectiveness(效果)?药物审批后,RWD常用于制定医保支付决策或准入协议。

 

本文整理自综述:

Nat Rev Clin Oncol. 2019 Jan 30. doi: 10.1038/s41571-019-0167-7.

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题