Science报道:利用公开数据库NHANES的低质量论文激增

本文整理自Science官网在2025年5月14日发表的一篇新闻报道,原标题是“Low-quality papers are surging by exploiting public data sets and AI”
2024年,《Scientific Reports》期刊副主编Matt Spick注意到大量内容雷同的论文投稿至该期刊。这些论文都使用了美国国家健康与营养调查(NHANES)的公开数据,NHANES通过体检、血液检测和访谈收集了超过13万人的膳食信息及健康相关指标。
英国萨里大学的统计学家Spick表示:"每天都会收到大量高度雷同的论文,有时甚至一天两篇"。Spick所在期刊收到的NHANES论文都遵循相同模板:选择一个健康问题、一个可能相关的环境或生理因素,以及特定人群——比如研究65岁以上男性维生素D水平与抑郁症的关联,或18-45岁女性口腔健康与糖尿病的关系。
Spick与同事于5月8日在《PLOS Biology》对此发表了一篇论文[1],指出近年来利用NHANES数据库撰写的低质论文数量激增,其中包括不合适的研究设计和错误结果。人工智能文本生成技术为此提供了便利。
研究团队在PubMed和Scopus两大论文数据库中检索了使用NHANES数据库进行的单一关联分析。结果发现147种期刊发表了341篇此类论文,包括《Scientific Reports》、《BMC Public Health》和《BMJ Open》等。
这种单一关联分析的研究,2014-2021年间年均发表4篇,2022年起开始激增,截至研究者2024年10月检索时,当年已发表190篇。
图A:利用NHANES数据库的单一因素分析;图B:利用NHANES数据库的论文总数
时间节点显示,ChatGPT等AI聊天机器人的普及可能是推动力。这些工具能根据简单指令和上传资料生成可读文本。《PLOS Biology》论文的审稿人Jennifer Byrne指出,AI可能被用于对相同内容进行无止境的改写,以规避抄袭检测。
Spick指出,许多新近的NHANES研究在缺乏合理依据的情况下选择性分析数据,例如仅采用特定年份或年龄段的样本,表示作者是在刻意寻找具有统计学显著性的结果。但在庞大数据库中"钓鱼"必然会产生大量假阳性结果。研究团队对28项关于抑郁症的NHANES研究进行复核发现,经过校正假阳性风险的统计调整后,仅13项结果的阳性仍成立。
Spick团队认为研究结果可能严重低估了问题的程度。他们的检索仅针对特定模板的NHANES研究,而更广泛的检索显示,使用该数据集发表的论文从2023年的4926篇升至2024年的7876篇。
未参与该研究的研究者Reese Richardson指出,这类免费数据源使得任何人都能套用已知研究方法,通过替换新变量来炮制"新发现",就像玩研究的"填词游戏"。其他学者也在遗传学研究、文献计量分析及不同学科性别差异研究等多个领域发现类似的"爆炸式增长"现象。
参考文献:
1. PLoS Biol. 2025 May 8;23(5):e3003152.
文章整理自:https://www.science.org/content/article/low-quality-papers-are-surging-exploiting-public-data-sets-and-ai
医咖会员全面升级,课程增多,AI工具升级!点击链接:会员-医咖社区 (mediecogroup.com),立享会员优惠!
