为了打击无法复现的AI研究,这些科学家组织了一场大赛

简介:
本文来自AI新媒体量子位(QbitAI)

看着论文里引人垂涎的结果,却无论如何也复现不出其中的算法,这样的痛苦,在当今人工智能研究界越来越普遍了。

2016年,《自然》面向1500名科学家发起了调查,发现在他们尝试复现其他科学家发表在学术期刊上的实验时,失败率高达70%,就算是自己的实验,也有一半复现不出来。

于是,有几位科学家想改变这种现状,将AI研究拉回正途。

4a03106870c3c98806c65eb58965e59c5c3387a7

 Joelle Pineau

随着上周ICLR 2018投稿论文列表的放出,他们做的努力也渐渐引起了关注。这几位科学家是麦吉尔大学副教授、Facebook蒙特利尔AI研究所主任Joelle Pineau、麦吉尔大学研究助理Genevieve Fried、蒙特利尔大学MILA博士生Rosemary Nan Ke、以及Google Brain研究员Hugo Larochelle。

他们为了打击无法复现的AI研究,组织了一项竞赛:ICLR 2018 Reproducibility Challenge。在这项“复现赛”中,参赛者需要试着复现ICLR 2018收到的论文,并评价论文的可复现性、以及参赛者的发现是否能支撑论文的结论。

ICLR 2018明年4月才开,不过,会议接收到的论文1003篇论文已经全部匿名公开,都成了这项比赛的赛题。

“如果你做科学研究,每一种科学研究在完成上,都有自己的流程。如果你构建的系统别人都做不出来,那么你所做的,是科学性的手艺,能为我们带来知识和理解上的进步,但是和科学结果有着不一样的结果。”比赛的协调者Pineau这样强调可复现性在科学研究中的地位。

目前AI研究的可复现性也的确不容乐观。

49e027194fb1229e4daff93cda72f3bf0ad96dd9

人工智能顶会ICML 2017发表的一项研究分析了30篇AI论文,发现大部分作者对于如何训练、如何校正他们的算法,都隐瞒了关键点。因此,重现他们的结果就非常难了。

论文的作者之一,英国基尔大学博士生Babatunde Olorisade说,大型科技公司在研究中所用的专属数据和信息,在论文中并没有明确体现,这就妨碍了整个领域的进步。

这次比赛涉及的论文中,就有不少出自最好的大学,也有不少出自Google、DeepMind、Facebook、微软、亚马逊等科技巨头。这回,它们将会受到学生们的严密审查。

复现赛没有丰厚的奖金,不过,参与者可能依然会非常多,主办方号召2017年秋季学期的机器学习研究生课程,能够将复现赛的赛题作为课程的期末项目。

Pineau在麦吉尔大学主讲的两门课程,就都参与到了这项竞赛中来。全球各地的教授们也纷纷响应,加拿大的拉瓦尔大学、滑铁卢大学、美国的密歇根大学、加州大学Irvine分校、以色列的特拉维夫大学,法国的ENS Cachan都参与了进来。这份名单还在不断地增加着。

让研究生尽可能地参与到复现赛之中来,为的是给AI行业带来良性循环:学生在竞赛中学会对研究进行审查,然后在他们自己的学术界或工业界生涯中,也保持对可复现性的关注。

Olorisade非常认同复现学术研究的价值:“可验证的知识是科学的基础,它事关理解。如果你证实了那些科学发现,就能对于它有更好的认识,如果这项发现是正确、可靠的,你就知道该从哪里去研究它的分支。”

Pineau希望这样的复现赛能年复一年地办下去。

她甚至希望“开放源代码”也成为发表AI研究结果的必选项。“我希望作者们对自己所声称的结果更加小心,”Pineau说,“我希望一些作者能够更多地思考如何开放自己的代码,将源代码的公开发表也作为科学流程的一部分。”

d4fcca82b3047ad3f367f486cce69ad5ab35bec1

要了解文中提到的复现赛详情,看这里:
http://www.cs.mcgill.ca/~jpineau/ICLR2018-ReproducibilityChallenge.html

《自然》对1500名科学家的调查:
http://www.nature.com/news/1-500-scientists-lift-the-lid-on-reproducibility-1.19970?WT.mc_id=FBK_NatureNews

ICML 2017论文Reproducibility in Machine Learning-Based Studies:
An Example of Text Mining:
https://openreview.net/pdf?id=By4l2PbQ-

QZ报道:
https://qz.com/1118671/the-titans-of-ai-are-getting-their-work-double-checked-by-students/

本文作者:夏乙
原文发布时间:2017-11-05
相关文章
|
5月前
|
数据采集 人工智能 自然语言处理
AI邂逅青年科学家,大模型化身科研“搭子”
2025年6月30日,首届魔搭开发者大会在北京举办,涵盖前沿模型、MCP、Agent等七大论坛。科研智能主题论坛汇聚多领域科学家,探讨AI与科研融合的未来方向。会上展示了AI在药物发现、生物计算、气候变化、历史文献处理等多个领域的创新应用,标志着AI for Science从工具辅助向智能体驱动的范式跃迁。阿里云通过“高校用云”计划推动科研智能化,助力全球科研创新。
|
2月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
|
6月前
|
机器学习/深度学习 人工智能 文字识别
UGPhysics:本科物理推理评估基准发布,助力AI+Physics交叉研究
近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。
187 0
|
3月前
|
机器学习/深度学习 人工智能 算法
一个大学生AI大赛题目
科研团队已经收集了一批货物的视觉图像数据,这些数据包含了货物的二维图像以及对应的真实形状标签。本体数据集包含2 个文件:gallery.csv 和queries.csv,以及对应的2个文件夹
133 23
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
|
4月前
|
人工智能
【千问海报大赛·地方风物】创意征集令!用AI解锁家乡新名片,万元奖金等你来战!
用Qwen-Image打破常规!将家乡的地标、方言、美食或热梗,通过错位混搭(赛博山水×古风建筑?霓虹城市×传统小吃?)或风格化创作(复古卡通、漫画方言…)焕发全新视觉冲击力!
202 10
|
5月前
|
机器学习/深度学习 人工智能 自动驾驶
AI Agent多模态融合策略研究与实证应用
本文从多模态信息融合的理论基础出发,构建了一个结合图像与文本的AI Agent模型,并通过PyTorch代码实现了完整的图文问答流程。未来,多模态智能体将在医疗、自动驾驶、虚拟助手等领域展现巨大潜力。模型优化的核心是提升不同模态的协同理解与推理能力,从而打造真正“理解世界”的AI Agent。
AI Agent多模态融合策略研究与实证应用
|
5月前
|
机器学习/深度学习 人工智能 算法
深度强化学习在异构环境中AI Agent行为泛化能力研究
随着人工智能技术的迅猛发展,AI Agent 在游戏、智能制造、自动驾驶等场景中已逐步展现出强大的自适应能力。特别是深度强化学习(Deep Reinforcement Learning, DRL)的引入,使得智能体能够通过与环境的交互,自动学习最优的行为策略。本文将系统性地探讨基于深度强化学习的AI Agent行为决策机制,并结合代码实战加以说明。
深度强化学习在异构环境中AI Agent行为泛化能力研究
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破
原来AI也能“读心术”?——聊聊AI在心理学研究中的那些突破
205 1
|
5月前
|
机器学习/深度学习 人工智能 算法
赛事获奖|TsingtaoAI斩获“华罗庚杯”创新创业大赛奖项,具身智能实训引领AI产业化人才培养新范式
在常州市科学技术局主办的2025“华罗庚杯”创新创业大赛具身智能专题赛决赛中,TsingtaoAI凭借 “具身智能实训道场研发及产业化”项目,从百余个创新项目中脱颖而出,荣膺 “优秀企业奖” 。
113 0

热门文章

最新文章