AI生成图像和视频,会如何影响科研?

将文本转为图像和视频的人工智能 (AI) 工具正在迅速发展。正如许多研究者将ChatGPT用于论文写作,也有研究者使用 Midjourney、Stable Diffusion 和 DALL-E 等 AI 图像生成工具来减少制作图表和插图所需的时间。然而,有人警告说,这些AI工具可能会导致虚假数据和不严谨图片增加。

文本转图像的AI工具是如何工作的?

许多文本到图像的AI工具,例如 Midjourney 和 DALL-E,都依赖于称为扩散模型的机器学习算法,这些算法经过训练可以识别互联网上的数百万张图像与这些图像的文本描述之间的联系。近年来,由于硬件改进和用于训练的大型数据集的出现,这些模型取得了巨大进步。训练后,扩散模型可以使用文本提示来生成新图像。

研究者可以用它们做什么?

一些研究者开始使用AI生成的图像来说明论文的研究方法;还有人使用这些工具在社交媒体帖子中宣传论文或为幻灯增添趣味性。有研究者会使用 DALL-E 3 生成吸引人的图像放到研究的汇报幻灯中,以吸引人们的注意力。

文本转视频的AI工具也在兴起,似乎还没有广泛使用,但这种情况可能很快就会改变。上个月,ChatGPT 创建者OpenAI 发布了由名为 Sora 的文本转视频工具所生成的视频。

https://dr2pp.oss.ns-svc.cn/Yk/YkuT/YkuTMj3oKBLque08Recu.jpg

图. Sora 等AI工具可以根据文本提示生成令人信服的视频片段

使用这些工具有什么好处?

生成式AI工具可以减少论文、会议海报或演示幻灯生成图像或图表所需的时间。以往,研究者使用一系列非人工智能工具,例如 PowerPoint、BioRender和Inkscape来做这些事情。AI工具还可以为那些很难将科学概念转化为视觉辅助工具的研究者提高图像质量。通过生成式人工智能,研究者可以提出图像的高级想法,使用AI来予以完善。

使用这些工具有哪些风险?

目前,AI工具可以生成令人信服的艺术作品和一些插图,但尚无法生成带有文本注释的复杂科学图片。2月中旬发表在《Frontiers in Cell and Developmental Biology》上的一篇论文暴露了可能出现的问题,这篇论文中,研究者使用 Midjourney 绘制大鼠的生殖器官。论文通过了同行评审,图片是一只卡通啮齿动物,但生殖器巨大得可怕,并附有乱七八糟的文字注释。

https://dr2pp.oss.ns-svc.cn/WN/WNPp/WNPp9ZFcD4yMFHDWoX8Y.jpg

插图展示了AI生成的大鼠和大鼠睾丸的精原干细胞

法国图卢兹大学研究AI生成欺诈文本的Guillaume Cabanac表示,该事件是“迄今为止涉及人工智能生成图像的最大案件”之一。在研究人员公开强烈抗议后,该论文被撤稿。

AI工具也有可能使学术造假者更容易生成虚假数据或结果。论文可能不仅包含AI生成的文本,还包含AI生成的图形。目前还没有可靠的方法来检测此类图像和视频。从某种意义上说,这将变得非常可怕,因为我们将受到虚假和合成数据的轰炸。