基于真实世界数据平台TriNetX的论文,正在爆发式增长
正值医咖会会员权益更新之际,可限时领取1年基础会员,20门基础课程随心看>>
每天早晨,Joshua Wang都会坐在电脑前,浏览基于热门研究平台TriNetX数据所发表的最新论文。近年来,基于该平台的研究论文数量激增,该平台可提供美国及海外超过3亿名患者的匿名电子健康记录。
平台网址:https://trinetx.com/
Wang是一名神经科学家,负责培训医院里的研究人员使用TriNetX平台,他注意到另一个趋势:有些研究者结果看起来很可疑。
他表示,这个易于使用的平台可能让缺乏经验的研究人员,可能利用人工智能(AI)的帮助,以前所未有的速度做出不可靠的研究。
麦吉尔大学药物流行病学家Samy Suissa说:“我们见过大量这类TriNetX研究,它们似乎都有非常相似的缺陷。例如,它们似乎总能发现惊人的效应,药物对各种结局都有显著益处。”
根据可追踪摘要和引文的Dimensions数据库,2025年,标题或摘要中提及TriNetX的论文近2700篇,而5年前仅为33篇。今年才过去不到一半,这一数字已超过2100篇。
TriNetX仅对参与其中的医疗机构的用户开放,大多数TriNetX论文来自美国医学院的作者。医学院将TriNetX作为研究训练场,由此产生的论文是医学生在申请住院医师培训前充实简历的一条相对容易的途径。
缺乏科研经验的用户与TriNetX的“一键式”分析工具相结合,可能导致不可靠的论文,这些论文往往无法校正潜在偏倚。而且由于数据分析速度极快,用户可能挑选阳性结果来发表,这种做法被称为p-hacking。
Wang说:“我最担心的是,10年后的医生想查阅某个概念,他们在文献库里发现所有东西都互相关联。”
TriNetX首席科学官Jeffrey Brown也认可,用户需要流行病学和统计学专业知识,论文也应经过严格的同行评审。但他补充说,“研究越来越多,我认为这是好事。”
Wang和许多其他研究人员有着不同看法。他们以发表在MDPI期刊《Cancers》上的一篇TriNetX论文为例,该论文曾引起媒体关注,声称发现了“令人信服的证据”,证明GLP-1减肥药能降低肥胖人群罹患多种癌症的风险[1]。但该论文未提及更未校正两种可能导致结果偏向阳性的关键偏倚:碰撞偏倚(collider bias)和永恒时间偏倚(immortal-time bias)。
该论文的两位通讯作者均未回复《Science》杂志的邮件提问,其中一人与一家减肥药厂商有未披露的利益关系。
还有一些情况,论文声称使用的分析,TriNetX平台实际上并不提供。Wang列举去年发表在《Angiology》上的一篇论文,该论文指出名为gliflozins的糖尿病药物可降低心脏病发作后的死亡风险[2]。作者是美国三所顶尖医学院的医生,他们论文中写道,在TriNetX内执行了一个关键步骤来校正永恒时间偏倚。但Wang知道TriNetX并不提供这样的工具。
Wang说,他写了数十封致编辑的信,指出研究中使用的方法存在问题。“要么他们伪造了方法,要么他们从另一篇文章或AI输出中复制了方法学语句,我认为两种情况都相当可怕。”
在回应《Science》的提问时,该研究的第一作者、克利夫兰诊所的内科住院医师Rochell Issa为这项研究辩护,重申了论文中所述的方法,但她拒绝回答关于在平台上如何具体执行分析的问题。《Angiology》论文的另一位作者否认使用AI来生成这项研究或研究中使用的方法或方案。
Wang等向七个大型语言模型(LLM)询问如何使用TriNetX完成校正永恒时间偏倚的关键步骤。有六个模型提出了在该平台上无法实现的方法,该报告发表于《European Journal of Epidemiology》[3]。
随后,研究人员在TriNetX论文中搜索LLM建议的这些方法,找到了8篇论文,其中就包括《Angiology》的研究。在其中5个案例中,美国医学生或住院医师出现在论文作者名单上,通常为第一作者。Wang此后又发现了5篇存在同样问题的论文。
TriNetX在针对Wang的研究所发表的公开回应中辩称,这8项研究仅占其软件完成工作的“极小一部分”。此外,TriNetX的人表示,描述了平台无法执行的方法“可能是由于误解、模糊术语、不完整的报告或在平台外进行分析而产生的”。
根据Dimensions数据库,Kaelber已积累发表了125篇TriNetX论文。他告诉《Science》,对该平台上进行低质量、不必要的研究表示担忧“完全合理”。但无论是他还是本报道联系的其他作者,都没有同意分享他们的TriNetX查询参数。
负责管理美国住院医师申请流程的AAMC正试图解决这些问题,在即将到来的申请周期,它将要求申请人将其发表列表的重点“从数量转向质量,强调有意义的贡献、参与深度以及申请人工作的影响力”。
与此同时,Wang继续他每日的警戒工作。在他自己的医院,寻求使用TriNetX的研究人员必须首先完成他的一小时培训课程。他说,希望“试着灌输一点敬畏之心,这样他们就不会贸然行事了”。
参考文献:
1. Cancers (Basel). 2024;17(1):78.
2. Angiology. 2026;77(6):704-713.
3. Eur J Epidemiol. 2026 Feb 21. doi: 10.1007/s10654-025-01342-6.
本文整理自:https://www.science.org/content/article/medical-students-are-using-popular-research-tool-pump-out-misleading-studies
