利用真实世界数据做好研究:关键的数据质量问题
李侗桐

李侗桐

北京大学

擅长:卫生统计学、定性分析方法、卫生经济学、全球卫生政策分析
已关注
关注
2019-03-11 来源:医咖会

2019年1月30日,《Nature Reviews Clinical Oncology》(影响因子:24.653)发表了一篇题为《Real- world data: towards achieving the achievable in cancer care》的综述,以肿瘤领域为例,详细介绍了真实世界数据

在上一篇文章中,我们用一个表格举例了利用患者、治疗和结局真实世界数据(RWD)的经典研究,详见:利用真实世界数据做好研究,来看诸多经典研究实例。。本文我们来聊一聊真实世界数据质量的相关问题

原始数据的质量

在使用RWD的研究中,原始数据的质量取决于数据完整性和准确性。一个关键问题在于数据随机缺失(missing at random)的程度:随机缺失数据会减低测量的准确性,而非随机缺失会导致结果偏倚。

因此,研究者需要仔细判断数据的真实性(即该数据是否可以反映真实的情况)和可靠性(即收集的数据是否具有一致性)。除了数据质量,还需要考虑数据的全面性。RWD的多数来源都缺少对患者预后、诊疗和结局信息的记录,例如体能状态、疾病分期、治疗意向及疾病负担等数据,这在疗效比较研究中尤其重要。

一些新型RWD尝试通过纳入其他的患者/疾病相关变量来解决这一问题。2018年的一项研究中,Khozin等利用电子健康档案(EHR)数据分析真实世界中纳武单抗(nivolumab)与派姆单抗(pembrolizumab)治疗非小细胞肺癌的结局差异。但是,以往常见的RWD数据来源中并不包含这项研究关注的预后指标,如吸烟情况和生物标记物信息等(包括PD-L1、EGFR或ALK)。

针对这种情况,研究者可以通过增加新的数据源来保证RWD研究数据的全面性。经典的例子如增加患者自评症状或儿童癌症幸存者的受教育情况等。当然,是否可以将其他数据源与癌症登记数据进行关联,取决于研究所在地的法律和伦理限制。

有问题
找小咖
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
数据库搭建
想提升科研效率和数据质量?扫码添加小E,立即咨询数据采集与管理相关产品和服务!查看详细>>
意见反馈