JAMA子刊:即使是顶级医学期刊,近半数观察性研究未说明混杂因素选择依据

牛治平

牛治平

复旦大学公共卫生学院

擅长:流行病与卫生统计、大型公开队列数据挖掘、空气污染等环境暴露评估、新现化合物暴露健康效应分析、系统综述和Meta分析
已关注
关注
2025-10-21 来源:医咖会

【2025年8月8日更新:值医咖会9周年之际,赶快去医咖会APP限时领取基础会员权益,含28张基础课程券,各种科研课程随心看】

观察性研究是探索疾病因果关联的重要手段,但其结论的可靠性高度依赖于能否有效控制混杂因素(Confounders)。2025年7月发表在JAMA Network Open上的一项题为“Confounder Selection in Observational Studies in High-Impact Medical and Epidemiological Journals”研究,系统回顾了近20年来顶级医学和流行病学期刊中观察性研究的混杂因素选择方法。研究结果令人惊讶:近一半的研究在选择调整哪些混杂因素时,竟然没有给出任何理由!

为什么混杂因素的选择如此重要?

在观察性研究中,混杂因素(如年龄、吸烟史等)可能同时与暴露因素和结局相关联,若不妥善处理,会扭曲对暴露-结局真实效应的估计。想象一下,你想研究“喝咖啡”(暴露)是否会导致“心脏病”(结局)。但“年龄”可能同时影响喝咖啡的习惯和心脏病风险——年龄就是一个混杂因素。如果不调整年龄,你可能会错误地将年龄的影响归因于咖啡。因此,准确识别并调整混杂因素是观察性研究得出可靠因果推论的关键前提

观察性研究中的混杂控制进步了吗?——20年顶刊证据评估与学科差异

该研究系统评估了2003、2013、2023年发表在顶级综合性医学期刊(NEJM、Lancet、JAMA、BMJ、Annals of Internal Medicine)和5本专业流行病学期刊(European J Epi, Int J Epi, Annals of Epi, American J Epi, Epidemiology)上的观察性研究的混杂因素选择方法。

通过筛选,最终纳入623项需控制混杂的观察性研究(197篇医学,426篇流行病学)。研究团队随机抽取50%文献(n=312)进行全文审阅,将混杂因素选择方法分为7类:未调整、调整但未指明变量、无理由选择、基于结局关联、依赖统计标准、采用因果模型(DAG或理论框架)。

即使顶尖期刊,混杂因素筛选方法和报告改进速度仍然缓慢

  • 选择依据的透明度有待提升: 在所有评估的研究中,有相当比例(45.1%, 281篇) 虽然报告了调整的混杂变量列表,但未阐述选择这些变量的具体理由或依据
  • 统计驱动方法仍有应用: 近五分之一的研究(19.4%, 121篇)主要依赖统计标准(如逐步回归、效应量变化策略)来选择调整变量,这类方法在方法学界对其潜在偏倚风险已有较多讨论。
  • 基于因果模型的方法应用正在增长但基数仍低: 明确报告使用基于因果理论模型(DAG或文本阐述) 来选择混杂因素的研究占6.7% (42篇)。其中35篇使用了DAG图进行可视化,7篇在文本中进行了系统阐述。值得欣慰的是,这种方法的应用呈现显著增长趋势。尽管如此,即使在2023年的流行病学期刊中,这一学界广泛推荐方法应用率仅为23.5%,占比仍不足四分之一
  • “未说明理由”的比例虽有下降但仍居高位: 未提供选择理由的研究比例,从2003年的48.7% (111/228) 下降到2023年的41.5% (68/164),显示有一定进步,但“未说明理由”仍是最高频的报告方式

  • 学科与设计差异: 流行病学期刊在更系统地报告选择依据(基于结局关联或因果模型)方面表现略好。医学期刊在2023年因果模型的使用率(20.0%)显著提升,但未说明理由的比例(48.9%)仍高于流行病学期刊(38.7%)。队列研究更倾向于使用因果模型(8.8%),而病例对照(2.1%)和横断面研究(2.1%)应用较少。

学界一致倡导采用基于因果理论模型筛选混杂因素,为何进展相对缓慢?

尽管方法学指南(如STROBE)和专家共识一直倡导基于因果理论模型筛选混杂因素,并指出了传统数据驱动方法的潜在局限,但即使在顶级期刊发表的观察性研究中,混杂因素的筛选和报告仍有较大提升空间,未能充分说明混杂因素选择依据的情况依然常见

导致这一现象的原因可能涉及多方面因素,例如研究者对现代因果推断方法(如DAG)的熟悉程度、研究实施中的时间与资源限制、期刊审稿过程中对方法学细节要求的侧重程度,以及改变固有习惯的难度。

如何提升观察性研究混杂因素筛选的严谨性?

这项研究的结果提示,提升观察性研究的严谨性需要研究共同体各方协同努力:

  • 研究者:应重视因果框架构建,在研究设计阶段使用DAG或理论框架明确定义变量关系,并在论文中详细说明混杂因素的选择依据,避免依赖逐步回归等传统统计方法。
  • 期刊与审稿人:需细化投稿要求,强化STROBE指南的执行,并在审稿中重点评估混杂因素选择的逻辑。同时,应推广方法学严谨的优秀研究,树立标杆。
  • 资助与学术机构:应加强方法学培训,将因果推断(如DAG)纳入课程体系,并在项目评审中优先支持研究设计严谨的课题,推动混杂因素筛选和报告的改进。

总结与展望

观察性研究是医学证据的重要来源,但混杂因素的选择与报告仍是方法学关键挑战。最新评估显示,虽然DAG等方法应用增加,多数研究仍缺乏选择依据的充分说明。提升这一环节的透明度和科学性对研究可信度至关重要,需要研究者、期刊和资助机构协同努力。只有构建严谨的学术生态,才能获得更加可靠的医学证据。

参考文献:Correia LCL, et al. Confounder Selection in Observational Studies in High-Impact Medical and Epidemiological Journals. JAMA Netw Open. 2025;8(7):e2524176. doi:10.1001/jamanetworkopen.2025.24176

评论
请先登录后再发表评论
发表评论
下载附件需认证
为保证平台的学术氛围,请先完成认证,认证可享受以下权益
基础课程券2张
200积分
确认
取消
APP下载 领课程券
扫码下载APP
领基础课程券
公众号
统计咨询
扫一扫添加小咖个人微信,立即咨询统计分析服务!
会员服务
SCI-AI工具
积分商城
意见反馈