为了打击无法复现的AI研究,这些科学家组织了一场大赛

简介:
本文来自AI新媒体量子位(QbitAI)

看着论文里引人垂涎的结果,却无论如何也复现不出其中的算法,这样的痛苦,在当今人工智能研究界越来越普遍了。

2016年,《自然》面向1500名科学家发起了调查,发现在他们尝试复现其他科学家发表在学术期刊上的实验时,失败率高达70%,就算是自己的实验,也有一半复现不出来。

于是,有几位科学家想改变这种现状,将AI研究拉回正途。

4a03106870c3c98806c65eb58965e59c5c3387a7

 Joelle Pineau

随着上周ICLR 2018投稿论文列表的放出,他们做的努力也渐渐引起了关注。这几位科学家是麦吉尔大学副教授、Facebook蒙特利尔AI研究所主任Joelle Pineau、麦吉尔大学研究助理Genevieve Fried、蒙特利尔大学MILA博士生Rosemary Nan Ke、以及Google Brain研究员Hugo Larochelle。

他们为了打击无法复现的AI研究,组织了一项竞赛:ICLR 2018 Reproducibility Challenge。在这项“复现赛”中,参赛者需要试着复现ICLR 2018收到的论文,并评价论文的可复现性、以及参赛者的发现是否能支撑论文的结论。

ICLR 2018明年4月才开,不过,会议接收到的论文1003篇论文已经全部匿名公开,都成了这项比赛的赛题。

“如果你做科学研究,每一种科学研究在完成上,都有自己的流程。如果你构建的系统别人都做不出来,那么你所做的,是科学性的手艺,能为我们带来知识和理解上的进步,但是和科学结果有着不一样的结果。”比赛的协调者Pineau这样强调可复现性在科学研究中的地位。

目前AI研究的可复现性也的确不容乐观。

49e027194fb1229e4daff93cda72f3bf0ad96dd9

人工智能顶会ICML 2017发表的一项研究分析了30篇AI论文,发现大部分作者对于如何训练、如何校正他们的算法,都隐瞒了关键点。因此,重现他们的结果就非常难了。

论文的作者之一,英国基尔大学博士生Babatunde Olorisade说,大型科技公司在研究中所用的专属数据和信息,在论文中并没有明确体现,这就妨碍了整个领域的进步。

这次比赛涉及的论文中,就有不少出自最好的大学,也有不少出自Google、DeepMind、Facebook、微软、亚马逊等科技巨头。这回,它们将会受到学生们的严密审查。

复现赛没有丰厚的奖金,不过,参与者可能依然会非常多,主办方号召2017年秋季学期的机器学习研究生课程,能够将复现赛的赛题作为课程的期末项目。

Pineau在麦吉尔大学主讲的两门课程,就都参与到了这项竞赛中来。全球各地的教授们也纷纷响应,加拿大的拉瓦尔大学、滑铁卢大学、美国的密歇根大学、加州大学Irvine分校、以色列的特拉维夫大学,法国的ENS Cachan都参与了进来。这份名单还在不断地增加着。

让研究生尽可能地参与到复现赛之中来,为的是给AI行业带来良性循环:学生在竞赛中学会对研究进行审查,然后在他们自己的学术界或工业界生涯中,也保持对可复现性的关注。

Olorisade非常认同复现学术研究的价值:“可验证的知识是科学的基础,它事关理解。如果你证实了那些科学发现,就能对于它有更好的认识,如果这项发现是正确、可靠的,你就知道该从哪里去研究它的分支。”

Pineau希望这样的复现赛能年复一年地办下去。

她甚至希望“开放源代码”也成为发表AI研究结果的必选项。“我希望作者们对自己所声称的结果更加小心,”Pineau说,“我希望一些作者能够更多地思考如何开放自己的代码,将源代码的公开发表也作为科学流程的一部分。”

d4fcca82b3047ad3f367f486cce69ad5ab35bec1

要了解文中提到的复现赛详情,看这里:
http://www.cs.mcgill.ca/~jpineau/ICLR2018-ReproducibilityChallenge.html

《自然》对1500名科学家的调查:
http://www.nature.com/news/1-500-scientists-lift-the-lid-on-reproducibility-1.19970?WT.mc_id=FBK_NatureNews

ICML 2017论文Reproducibility in Machine Learning-Based Studies:
An Example of Text Mining:
https://openreview.net/pdf?id=By4l2PbQ-

QZ报道:
https://qz.com/1118671/the-titans-of-ai-are-getting-their-work-double-checked-by-students/

本文作者:夏乙
原文发布时间:2017-11-05
相关文章
|
1月前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
33 1
|
13天前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
37 12
|
12天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
24天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
42 4
|
1月前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
39 6
|
1月前
|
数据采集 人工智能 算法
近五千支队伍决战AI之巅, AFAC2024金融智能创新大赛在2024 Inclusion · 外滩大会完美收官
自从2022年12月ChatGPT上线以来,全球掀起了一场你追我赶的AI竞赛,不少国家都在全力以赴,抢占制高点。
|
1月前
|
人工智能 自然语言处理 机器人
MIT新研究揭秘AI洗脑术!AI聊天诱导人类编造记忆,真假难辨
麻省理工学院的一项新研究《基于大型语言模型的对话式AI在证人访谈中加剧虚假记忆》显示,使用生成式聊天机器人进行犯罪证人访谈会显著增加参与者的虚假记忆,且影响持久。研究设置了对照组、问卷访谈、预设脚本及生成式聊天机器人四种条件,结果显示生成式聊天机器人诱导的虚假记忆数量远超其他方法。尽管AI技术在效率和准确性方面潜力巨大,但在敏感领域需谨慎应用,并需进一步评估风险,制定伦理准则和监管措施。论文详细内容见[这里](https://arxiv.org/abs/2408.04681)。
45 2
|
1月前
|
人工智能 供应链 安全
BSI 第七届万物互联智慧高峰论坛:主题:拥抱AI时代,标准赋能组织实现可持续发展
BSI 第七届万物互联智慧高峰论坛:主题:拥抱AI时代,标准赋能组织实现可持续发展
42 0
|
2月前
|
存储 人工智能 JavaScript
根据Accenture的研究,CEO和CFO谈论AI和GenAI是有原因的
数字化转型与当前GenAI领导者之间的关键区别在于,CEO和CFO(而非CIO)似乎参与了指导AI投资的过程。例如,Accenture在2024年1月报告称,到2023年底,在财报电话会议中提到AI的次数几乎达到4万次,因为C级领导层正在为“重大技术变革”做好准备
41 1
|
1月前
|
机器学习/深度学习 存储 人工智能
2024年诺贝尔奖:AI科学家的辉煌时刻 | AI大咖说
在今年的诺贝尔物理学奖和化学奖颁奖典礼上,AI科学家分别摘得了这两项殊荣,这无疑为AI技术的发展和应用注入了新的动力【10月更文挑战第5天】
68 0

热门文章

最新文章

下一篇
无影云桌面