病例对照研究:利用“真实世界”证据来发现相关性

专题合集更多教程

作者:吴丽雯

 

近年来,“真实世界证据”成为了临床研究者和统计专家讨论的热点,我们要如何把“真实世界”数据应用在自己的研究中呢?2018年底,来自美国FDA的Telba Irony 博士在JAMA上发表了一篇文章,结合Wang Ment-Ting博士发表的一篇巢式病例对照研究,讲解“真实世界”数据的应用和局限性

 

Wang Ment-Ting发表的这篇巢式病例对照研究于2018年在JAMA内科学上发表,标题为《Association of cardiovascular risk with inhaled long-acting bronchodilators in patients with chronic obstructive pulmonary disease: a nested case-control study》。

 

通过巢式病例对照研究来分析慢性阻塞性肺疾病(COPD)患者中,吸入长效b2受体激动剂(LABA)和长效毒蕈碱受体拮抗剂(LAMA)与心血管疾病(CVD)之间的相关性。研究数据来自台湾全民健康保险研究资料库(NHIRD)。

 

· 什么是病例对照研究和巢式病例对照研究?

 

病例对照研究通过比较特定疾病的患者(病例)与不患有该病的个体(对照)之间,可能的风险因素上的区别,来判断风险因素和疾病之间的关联性。

 

巢式病例对照研究与普通病例对照研究不同的地方在于,病例是从一个较大的队列当中选择。并且,对于每一个病例,都从同一个队列当中选取一定数量的对照,与之相匹配。挑选对照的标准应该是让对照在除了所研究风险因素外的其他特征上,都与所对应的病例具有可比性。(具体可查看医咖会既往推文:巢式病例对照研究,到底是怎么设计的?

 

在病例相对罕见的情况下,寻找对照往往比寻找病例更容易,所以研究者们也会选择通过提高配对比例(例如2或3个对照匹配1个病例),来获得更准确的研究结果。

 

图1  一项病例对照研究范例

 

在这篇巢式病例对照研究中,研究者从NHIRD 2007至2011年的医保数据中,获得了284220例还未接受过LABA或者LAMA治疗的COPD患者数据。病例(n=37719)的定义为:在随访期间(中位随访时间2年),因为心血管疾病(包括冠状动脉疾病,心衰,缺血性卒中,以及心律失常)住院或到急诊就诊的患者。每个病例匹配了4个没有上述疾病的对照(n=146139)。

 

在病例对照研究中,一个常用的衡量关联性的指标是OR值(也叫做比值比)。

 

(关于OR值的详细解释请看以下链接:【合集】OR、RR、HR...还没搞清楚?那是因为你还没看过这个!)

 

未接受过LABA或者LAMA治疗的COPD患者中,病例组(n=37719)开始接受LABA治疗的患者占1.4%(n=520)、对照组(n=146139)的这个比例为0.8%(n=1186)。接受LABA治疗30天内发生心血管风险的校正OR值为1.50(95%CI,1.35-1.67)。

 

病例组开始接受LAMA治疗的患者占0.5%(n=190)、对照组为0.3%(n=463),接受LAMA治疗30天内发生心血管风险的校正OR值为1.52(95%CI,1.28-1.80)。

 

研究显示,COPD患者起始LABA或者LAMA治疗,与30天内心血管疾病风险增加具有相关性。

 

图2 

 

· 病例对照研究的局限

 

因为病例对照研究是回顾性的,所以必须要确保数据的质量以避免偏倚。因为研究者在分析过去发生的结局和暴露,这些研究结果很有可能有回忆偏倚和观察者偏倚。因为对照是回顾性选择的,也常常会有选择偏倚,这可能会导致病例组和对照组不具有可比性。

 

病例对照研究得出的结论不如RCTs具有说服力。这是因为,病例对照研究中难以排除混杂因素的影响,特别是没有被测量到的混杂因素,而RCTs中因为治疗分组是随机分配的,两组间的可比性更高。

 

病例对照研究的目标是比较不同暴露下患病情况的差异。为了达到这个目的,相对风险(RR)比OR值要直接。然而,病例对照研究无法计算出人群的疾病发病率,无法计算RR, 只能计算OR。另外,病例对照研究一次只能研究一个疾病结局,而且我们很难研究暴露和疾病之间的时间关系。

 

尽管有这些局限,病例对照研究和其他“真实世界”证据仍可以提供宝贵的经验证据和RCTs互补。并且,当RCTs不可行或者不符合研究伦理的时候,病例对照研究成为了一个有力的工具。

 

· 这些局限在上述案例研究当中如何被克服的?

 

在Wang Ment-Ting博士发表的巢式病例对照研究中,收集了病例和对照组的LABA和LAMA暴露时长(从第一次接受治疗到心血管结局),并且以此为依据来进行分层:current(<=30天),recent(31-90天),past(91-180天),和remote(>180天)。额外的分层变量包括COPD伴随用药,和其他的一些变量(具体见研究原文,PMID:29297057)。

 

该研究的数据来源(NHIRD)覆盖面广,格式统一,强制收集,并且经过定期审查,所以数据质量比较有保障。总体来说,因为作者的研究设计考虑到了如何提高数据质量和组间可比性,这也让研究结论更加可信。

 

图3  敏感性分析

 

· 病例对照设计如何影响我们对数据的理解

 

因为可能存在未测量到的混杂因素,我们无法通过病例对照研究建立因果关系。在Wang Ment-Ting博士的文章里,研究者利用了疾病风险评分来预测心血管结局,这样可以较好控制已被测量的混杂因素,然而对于未测量的混杂因素则无能为力。作者通过充分的敏感性分析来论证存在其他未测量的混杂因素的可能性不大。

 

参考文献:

1.  JAMA, 320(10): 1027-1028.

2. JAMA internal medicine, 178(2): 229-238.

 

扫码关注“医咖会”公众号,及时获取最新统计教程!

描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
我要提问
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
提交问题
描述问题
选择一个标签 (请选择一个与您问题最相符的标签)
    提交问题