AI已经参与论文打假了

简介: AI已经参与论文打假了

现在的AI已经开始参与论文打假了!


就像是这样,经过旋转、拉伸和缩放之后的图片,人眼或许无法辨认,但AI能看到数百个相似的特征:


67d31f7f1da88b52fa5aa412e798f686.png


△蓝色线条表示相似特征


即使通过高超的“图像处理手段”把一张完整图像中的局部画面挪到自己的图像里,也能一眼分辨:


8aa9625dae580fb5bf7d4089c7aaa686.png


对于AI来说,这可能是秒认的活儿,甚至就算是一篇图像繁杂的完整论文,也不过花费一两分钟。


但对于人眼可就没那么简单了,比如知名学术打假人Elisabeth Bik为了寻找不同论文中使用相同图片展示各自不同的实验结果的例子,曾花费了整整2年时间。


而对于出版商们来说,刊登又撤稿中间的损失就更大了……


因此,最近几年,AI打假员愈发频繁地被引入了论文审查,尤其是图像问题中。


比如,自今年1月份开始,世界上最大、最古老的癌症研究专业协会,美国癌症协会(AACR)就已经开始使用AI软件来评审旗下期刊文章里的图片造假或重复问题了。


官方网站上也已经写明:提交手稿中的所有图像都需要通过AI软件进行筛选。


92ba4caabdd92c5854bbab9bbafb580e.png


不仅是AACR,世界第五大出版商SAGE、老牌经典医学期刊JCI、 JCI Insight都已经用上了这种方法。


自动图像校对



这些期刊和出版商们所使用的是一个由以色列公司Proofig开发的同名软件。


Proofig软件基于AI技术和图像处理技术,面向各种科学文稿中的图像,包括所有类型的显微镜照片(光学、电学、共聚焦)、载玻片、蛋白免疫印迹(Western blot)、生物体内和体外图像、植物图像等等。


d2164fbb4e443319dc87a26d3d690313.png

软件会从论文中识别图像,然后提取它们共同的特征进行比较。


这些“共同的特征”包括对图像整体的缩放或旋转、部分重复或重叠、还有一些方位上的不同。


除此之外,软件也能额外检测到一些问题,比如高分辨率的原始数据被压缩到更小的文件中时,可能出现的压缩失真或压缩伪影(Compression artifact)情况。


59ea4606b896c3dd2d56d66d6e06a48f.png


一篇普通的论文通常在2分钟以内可以检查完毕,最多不超过10分钟。


对于很多出版商来说,一篇已刊登的科学文稿里如果出现图像剽窃这种学术不端的现象,那么从调查、撤稿到后续的法律费用,平均每篇文章可能要损失百万美元。


因此,很多出版商都乐意引入性价比较高的AI来和人工审查组一起工作。


AACR的一位期刊运营总监就表示:


很多作者也很高兴能在出版前注意到一些“无意中的”图像复制错误。


而对于我们来说,严谨的数据是我们期刊的一个显著的标志,因此,这(Proofig)绝对是值得投入的时间和金钱。


出版商们联合起来



其实,科学文稿中的图像重复或剽窃的现象已经是屡见不鲜了。


2016年,Nature上就有一篇文章对约2万篇生物医学论文进行人工分析后发现,其中**4%**的论文都可能包含上述问题。


4159baed47ecc5f0bea914cdeb223441.png


而通常每年只有1%的文稿得到更正,因此撤回的文章就更少了。


因此,去年5月份,一些出版商联合起来成立了一个为解决论文中图像问题的小组,其中包括荷兰出版业巨头爱思唯尔(Elsevier)、Wiley、Springer Nature和Taylor & Francis。


爱思唯尔表示,小组最终的目标是“创造一个能够帮助我们自动识别图像变化的环境。”


faea1b71b5c0c9f2a10c11ec1873108a.png


还有很多出版商试图自己解决问题,比如瑞士出版商Frontiers开发了自己的论文图像检查软件,作为自动检查系统AIRA的一部分。


Frontiers内部的一位发言人表示,软件自2020年8月投入使用,标记的大多数论文都没有问题, 只有大约10%的论文需要人工检查小组的跟踪处理。


而有些尚未引入AI手段的出版商也展现出了对这种方法的怀疑:


在可靠性上,AI检查还没有大规模地投入使用。比如爱思唯尔的软件目前的进度还是“正在测试中“,只对部分期刊开放使用。


在成本上,AI软件偶尔的“误杀”依旧需要人工参与,甚至会引起其他的纠纷。


不过有人从另一个角度提出了问题:


如果所有的论文都是开放存取的,那么图像误用/重复问题将更容易得到审查,训练AI也会更有效率。


a6ce930a79293109b96df0a2d49267c9.png


参考链接:


[1]https://www.nature.com/articles/d41586-021-03807-6

[2]https://www.nature.com/articles/nature.2016.19802


相关文章
|
7月前
|
机器学习/深度学习 人工智能 安全
【论文速递】CSET - 小数据的大AI潜力
【论文速递】CSET - 小数据的大AI潜力
63 0
|
3月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
69 4
|
7月前
|
机器学习/深度学习 人工智能 数据挖掘
ICLR 49.9%论文疑有AI审稿
【5月更文挑战第20天】ICLR会议上一篇研究引发关注,推测近50%的论文可能由AI进行审稿,挑战传统审稿流程。研究者运用机器学习分析历史审稿数据,发现可能的AI审稿模式。该研究提出AI审稿可减轻审稿人负担,提高效率,但也面临证据不足、理解复杂学术概念限制及审稿行为多样性等问题。学术界需谨慎评估AI在审稿中的角色,以确保质量和公正性。[论文链接](https://arxiv.org/abs/2405.02150)
108 1
|
7月前
|
人工智能
AI大咖说-如何评价论文的创新性
《AI大咖说》探讨论文创新性,强调新意、有效性和领域研究问题的重要性。创新点在于用新颖方法有效解决研究问题。评价公式:价值=问题大小*有效性*新意度。该观点源于《跟李沐学AI》视频,提供1-100分评分标准,助力评估论文价值。5月更文挑战第14天
99 3
|
7月前
|
机器学习/深度学习 人工智能
论文介绍:AI击败最先进全球洪水预警系统,提前7天预测河流洪水
【5月更文挑战第4天】研究人员开发的AI模型(基于LSTM网络)成功击败全球最先进的洪水预警系统,能在未设测站流域提前7天预测洪水,显著提升预警时间,降低灾害影响。该模型使用公开数据集,减少了对长期观测数据的依赖,降低了预警系统的成本,有望帮助资源有限的地区。然而,模型的性能可能受特定流域条件影响,泛化能力和预测解释性仍有待改进。[论文链接](https://www.nature.com/articles/s41586-024-07145-1)
174 11
|
7月前
|
机器学习/深度学习 人工智能
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
【2月更文挑战第25天】ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
101 7
ChatGPT检测器——以前所未有的准确性捕捉AI生成的论文
|
7月前
|
人工智能
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。
237 4
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
|
7月前
|
数据采集 人工智能 数据挖掘
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
406 0
【AI大模型应用开发】【附】常用Prompt记录 - 论文全文写作
|
7月前
|
机器学习/深度学习 人工智能 知识图谱
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
【2月更文挑战第16天】LeCun视觉世界模型论文,揭示AI学习物理世界的关键
76 2
LeCun视觉世界模型论文,揭示AI学习物理世界的关键
|
7月前
|
机器学习/深度学习 人工智能 算法
AI大咖说-如何有效的读论文
# AI大咖李沐教你高效读论文 李沐,亚马逊资深首席科学家,MXNet框架作者,推荐其在B站的“跟李沐学AI”。他建议读论文分三步:粗读(标题、摘要、结论)、快速浏览(整体理解)和精读(深入细节)。通过这三遍阅读,判断论文是否相关,理解解决问题的方法和实验。5月更文挑战第13天
92 0