1分钟就能查出整篇论文的图片误用:这个AI是有些火眼金睛在身上的

简介: 1分钟就能查出整篇论文的图片误用:这个AI是有些火眼金睛在身上的

看一张论文图,两个红框内的图像,有何相似之处?

image.png

对于人类来说,两只眼睛实在很难迅速分辨,但 AI 就能在极短的时间内指出数百个相似特征:

image.png

蓝线为相似特征。

旋转、过滤、翻转、拉伸…… 像这样的篡改手段,AI 一眼就能看出来,哪怕是检查完整篇论文里所有图片,也只需要一两分钟。

再来 6 张不同的子图像,你能找出重复的地方吗?

image.png

AI 标出了 3 个重复(红框所示)。蓝线表示图像中相似特征的位置,线相交的地方表示图像发生了旋转。1 和 2 是旋转了 180 度,3 旋转了 90 度。

image.png

这个 AI,是有些火眼金睛在身上的。

走进「全自动时代」

为了避免发表的论文中带有被篡改过的图像,许多期刊都会聘请专门的人员来检查这些提交上来的手稿图片,当然这个过程也是在软件的协助之下。现在,这个过程似乎开始变得完全「自动化」了。

从 2021 年 1 月起,美国癌症协会(AACR)开始采用一款叫做「Proofig」的 AI 软件,检查那些经过同行评审后临时接收的文稿,这款软件能够自动提醒编辑哪些图像有哪些重复的部分。

《Nature》杂志发现,过去一年里,至少有四家出版商开始采用 AI 软件,在稿件发表之前发现图片中重复的部分,不管这种「重复」是出于抄袭的目的,或者只是不恰当的美化方法。

2016 年,一项分析了大约 20000 篇生物医学论文的研究表明,多达 4% 的论文可能都存在图像重复问题。实际上,这个问题比论文更正和撤回等问题更严重、更广泛,每年大概只有大约 1% 的论文得到更正,被撤回的论文就更少了。

image.png

此前,当软件被用来标记图像问题时,仍然需要一位专业编辑来决定如何处理。例如,如果数据集被特意展示了两次,文中也有解释,那么重复的图像就不算是问题;又比如,一些重复可能是手稿组装过程中简单的复制和粘贴错误,并不是欺诈,这种情况只能通过编辑和作者之间的沟通来解决。

专家表示,随着人工智能软件变得足够有效且成本低廉,一系列的图像自动检查工具可能会在未来几年席卷科学出版行业。

研究者一直在开发图像检查相关的  AI 技术。2020  年,出版商成立了一个工作组,专门为图像问题筛选的软件制定了标准,又在今年发布了编辑如何处理篡改图像的指导方针。开发此类软件的公司不只「Proofig」一家,但它是第一家公开了自己客户名字的公司,除了  AACR 之外,美国临床调查学会今年 7 月份也开始使用 Proofig,SAGE Publishing 在 10  月份的五份生命科学期刊中也采用了该软件。

Proofig 软件从论文中提取图像,并将它们成对地进行比较找出共同特征,包括部分重复。一般的论文在一两分钟内就能完成检查,还能顺便查出一些其他小问题,比如将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。

image.png

这一切工作,都能在几分钟之内完成,你要做的就是上传 PDF,确认图片都被选中了,等待一会儿,下载 PDF 报告即可。

image.png

图像检查的成本远高于抄袭检查每篇论文不到 1 美元的成本。Proofig 与出版商签订的合同中,费用是根据论文中的图像数量收取的,但这也取决于手稿的数量,相当于每篇论文的收费「大概几十美元,而不是几百美元」。

「计算机视觉比人类视觉更有优势,」公司创始人 Dror Kolodkin-Gal 表示。「计算机不仅不会感到疲倦,运行速度也会更快,而且它也不会受到大小、位置、方向、重叠、部分复制和这些因素组合的影响。」

软件发现的问题比此前编辑手动检查的问题要多,但是编辑对于 Proofig 输出结果的把控仍然必不可少。

与此同时,位于瑞士洛桑的出版商  Frontiers 也开发了自己的图像检查软件,成为 AIRA 自动检查系统的一部分。自 2020 年 8  月以来,这家出版商内部的研究诚信团队一直在使用 AIRA 对所有提交的手稿进行图像检查。在被选中标记的论文中,大多数没有问题,只有大约 10%  需要该团队再跟进。

除了重复问题之外,检测图像处理也很重要,例如删除或裁剪了图像的一部分,以及其他 PS 痕迹。Frontiers 的软件是人工视觉筛选的有用补充,但它可能无法完全替代当前形式。

仍有出版商保持谨慎

尚未采用 AI 图像检查工具的出版商提到了成本和可靠性问题,其中一些出版商正在开发自己的 AI,包括 PLOS 和爱思唯尔等大型出版商。

2020  年 4 月,Wiley 面向临时接收的手稿推出了图像筛查服务,目前已用于 120 多种期刊,但还是由软件辅助的手动筛查。Springer  Nature 表示,它正在评估一些外部工具,同时也在整理数据以训练自己的软件,该软件将「人工智能和人类结合互补来识别有问题的图像」。

像 EMBO Press 这样的出版商仍然主要使用手动筛查方法,因为他们还不相信商业产品的成本效益比,除此之外,还有另外一层担心:欺诈者可能会了解该软件的工作原理,并使用 AI 制作人类和软件都无法检测到的虚假图像。

尽管还没有证据表明此类图像已经出现在研究论文中,但去年发布在 bioRxiv 上的一份预印本表明,制作与真实数据无法区分的生物图像伪造版本是有可能的,比如蛋白质印迹。

image.png

论文链接:https://www.biorxiv.org/content/10.1101/2020.11.24.395319v2

研究人员也在努力解决这个问题:计算机科学家 Edward Delp 在美国国防高级研究计划局资助的一个项目带领团队专注于伪造的生物图像,例如显微镜图像和 X 射线。他们拥有一组检测器,用于检测 GAN 生成的逼真图像。

相关文章
|
5月前
|
人工智能 数据可视化 数据挖掘
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。
322 34
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
679 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
6月前
|
人工智能 自然语言处理 机器人
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架,可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力,通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题,研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集,涵盖多样化的场景和相机运动。
332 2
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
|
6月前
|
人工智能 安全 测试技术
本周 AI Benchmark 方向论文推荐
由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench,是一个专为评估大型语言模型(LLMs)在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例,专注于新功能的实现。研究表明,即使是先进的 LLMs 在此任务中的表现仍远低于预期,揭示了仓库级代码开发的重大挑战。
240 0
|
5月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
1802 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
5月前
|
机器学习/深度学习 人工智能 JSON
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
Paper2Code是由韩国科学技术院与DeepAuto.ai联合开发的多智能体框架,通过规划、分析和代码生成三阶段流程,将机器学习论文自动转化为可执行代码仓库,显著提升科研复现效率。
605 19
这个AI把arXiv变成代码工厂,快速复现顶会算法!Paper2Code:AI论文自动转代码神器,多智能体框架颠覆科研复现
|
4月前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
1080 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
6月前
|
人工智能 小程序 前端开发
【一步步开发AI运动小程序】十九、运动识别中如何解析RGBA帧图片?
本文介绍了如何将相机抽取的RGBA帧图像解析为`.jpg`或`.png`格式,适用于体测、赛事等场景。首先讲解了RGBA图像结构,其为一维数组,每四个元素表示一个像素的颜色与透明度值。接着通过`uni.createOffscreenCanvas()`创建离屏画布以减少绘制干扰,并提供代码实现,将RGBA数据逐像素绘制到画布上生成图片。最后说明了为何不直接使用拍照API及图像转换的调用频率建议,强调应先暂存帧数据,运动结束后再进行转换和上传,以优化性能。
|
人工智能 缓存 NoSQL
【深度】企业 AI 落地实践(四):如何构建端到端的 AI 应用观测体系
本文探讨了AI应用在实际落地过程中面临的三大核心问题:如何高效使用AI模型、控制成本以及保障输出质量。文章详细分析了AI应用的典型架构,并提出通过全栈可观测体系实现从用户端到模型推理层的端到端监控与诊断。结合阿里云的实践经验,介绍了基于OpenTelemetry的Trace全链路追踪、关键性能指标(如TTFT、TPOT)采集、模型质量评估与MCP工具调用观测等技术手段,帮助企业在生产环境中实现AI应用的稳定、高效运行。同时,针对Dify等低代码平台的应用部署与优化提供了具体建议,助力企业构建可扩展、可观测的AI应用体系。
|
1月前
|
机器学习/深度学习 人工智能 PyTorch
GPT为定制AI应用工程师转型第一周学习计划
本计划帮助开发者快速入门AI领域,首周涵盖AI基础理论、Python编程及PyTorch实战。前两天学习机器学习、深度学习与Transformer核心概念,掌握LLM工作原理。第三至四天快速掌握Python语法与Jupyter使用,完成基础编程任务。第五至七天学习PyTorch,动手训练MNIST手写识别模型,理解Tensor操作与神经网络构建。
105 0

热门文章

最新文章