特朗普要求删除性别多样性信息,全球科学家在混乱中争相备份数据库

1月30日深夜,生物信息学家Niema Moshiri收到了一位长期合作者的紧急消息,敦促他备份美国疾病控制与预防中心(CDC)的网站。当时,有传言称,这家负责追踪疾病爆发并公开数据的公共卫生机构将开始从其网站上删除页面,以响应总统特朗普发布的行政命令,即要求政府部门删除有关性别多样性的公共信息。

Moshiri是加州大学圣地亚哥分校的研究员,自称“数据囤积者”,他习惯于备份个人视频、在线收据和账单。他表示:“我从未想过需要为联邦政府的信息页面做备份。”

数据下架与恢复

在过去的一周里,一些包含重要公共卫生和人口统计数据的美国联邦政府网站被下架,如全球抗击HIV项目和国家慢性病调查。目前部分数据已恢复,但仍有部分数据尚未恢复。Moshiri表示:“他们随意删除页面的行为让我感到震惊。”

Moshiri是美国乃至全球数十名争相备份联邦政府网站公共信息的研究人员之一。加拿大萨斯喀彻温大学的病毒学家Angela Rasmussen表示:“很多人都在做类似的备份工作,尤其是在他们自己的专业领域内。”她熬夜到凌晨2点,手动下载了流感监测等数据集。她补充说,研究人员正在想办法将这些备份数据公开。

CDC及其上级机构美国卫生与公众服务部表示,所有网站更改均符合特朗普的行政命令。

全球备份行动

上周末,Moshiri联系了密歇根州底特律附近的医疗政策与数据分析师Charles Gaba。Moshiri帮助Gaba创建了一个按字母顺序排列的CDC网页链接列表,共计7000多个页面。Gaba手动将这些链接重定向到Wayback Machine(由加州旧金山的非营利组织互联网档案馆维护的服务)上的版本。Gaba随后将整个列表发布在他的博客上。Gaba表示:“这花了好几天时间。很多数据至关重要,但你不知道哪些数据被删除了,哪些还在。”

Moshiri在他的硬盘上备份了CDC网站、所有CDC数据集、FDA和其他政府网站。他表示:“这些数据非常小,可以放在一个U盘里。”Moshiri尚未公开分享他的备份。如果他的大学同意这属于他的职责范围,他希望发布CDC网站的完整未改动副本。他的长期目标是备份所有联邦政府网站。

法律与伦理问题

费城公共利益技术与媒体律师事务所Albert Sellars LLP的律师Kendra Albert表示,一般来说,下载政府数据集、备份政府网站并分享它们是合法的。如果数据中包含受版权保护的材料,出于研究、倡导或作为历史记录的目的,复制和分享这些材料通常属于合理使用范畴。

互联网档案馆还支持一项倡议,即在每届美国总统任期开始和结束时存档政府网页。斯坦福大学图书馆员James Jacobs希望,科学家们备份的政府网站可以成为公众访问的中心。

公共卫生调查的风险

华盛顿特区非营利组织凯撒家庭基金会的Cynthia Cox在1月30日也听到了类似的传言。她的数据分析团队连夜下载了他们可能需要但尚未保存的调查数据集。这些调查数据用于监测从肥胖到乳腺癌筛查等公共卫生问题。Cox表示:“没有这些调查,我们作为一个国家将无法应对重大公共卫生问题。”她补充说,她已经从事这项工作近15年,从未见过这种情况。

一些数据集已经恢复,包括涉及性别问题的数据集,但并非所有分析所需的辅助问卷和代码本都已恢复。其他数据集,如与HIV监测相关的数据集,尚未恢复。

Cox担心未来进行公共卫生调查和分享这些数据是否会依然困难。她说:“未来的情况仍然是一个大问号。”对于已经恢复的数据集,Rasmussen对它们的持久性表示怀疑:“我不太相信它们会永远保持在线。”

文章整理自Nature官网: https://www.nature.com/articles/d41586-025-00374-y