传送门!ICML2017(国际机器学习大会)最佳论文(附下载)

简介:
本文来自AI新媒体量子位(QbitAI)

8月6日,第34届国际机器学习大会(ICML 2017)已在悉尼拉开帷幕。

其中最受关注的论文奖项已公布。

据主办方消息,ICML2017共评审了1676篇论文,收录了434篇,录取率为25.89%。

最佳论文奖由斯坦福大学Pang Wei Koh和Percy Liang的论文Understanding Black-box Predictions via Influence Functions获得。最具时间价值奖则是2007年巴黎南大学和阿尔伯塔大学共同投递的论文Combining Online and Offline Knowledge in UCT。

量子位整理传送如下:

最佳论文奖

论文:Understanding Black-box Predictions via Influence Functions(通过影响函数理解黑箱预测问题)
作者:Pang Wei Koh、Percy Liang
单位:斯坦福大学

摘要:应该如何解释黑箱模型预测环境?在这篇论文中,我们用稳健统计学中的一种经典方法探索模型预测问题。通过学习算法和其背后的训练数据,模型能够识别给定预测最合理的训练点数。为了使影响函数应用在机器学习任务上,我们创建了一种简单且高效的实现方式,它仅需要梯度oracle访问途径和Hessian矢量积。虽然在非凸模型和不可微分模型中这个理论还不成立,但近似影响函数仍能提供有价值的信息。在这篇论文中,我们演示了影响函数在线性模型和卷积神经网络的多种任务的表现,包括理解模型表现、调试模型、检测数据集错误、甚至出创造视觉无法区分的训练集攻击类型。

论文下载地址:http://proceedings.mlr.press/v70/koh17a/koh17a.pdf

最佳论文提名

论文:Lost Relatives of the Gumbel Trick
作者:Matej Balog、Nilesh Tripuraneni、Zoubin Ghahramani、Adrian Weller
单位:剑桥大学、马克斯普朗克智能系统研究所等

摘要:Gumbel技巧是从离散概率分布中抽样或估计其归一化分区函数的方法。该方法取决于以特定方式重复对分布进行随机扰动,每次求解最可能的配置。我们得出了一系列相关的方法,其中Gumbel技巧是其中一种,并且表明新方法在几个设置中具有优越的性能,以及最小的附加计算成本。另外,对于Gum-bel技术来为离散图模型(discrete graphical model)有计算优势,所有配置的Gumbel扰动通常被所谓的低等级扰动(low-rank perturbations)所替代。我们展示了我们新方法的子系列如何适应这种设置,证明了对数分区函数的新的上限和下限,并得出了吉布斯分布(Gibbs distribution)的一系列重要采样器。最后,我们展示了如何通过更简单的Gumbel技巧来简化分析形式,推导出额外的理论结果。

下载地址:http://proceedings.mlr.press/v70/balog17a/balog17a.pdf

论文:Modular Multitask Reinforcement Learning with Policy Sketches
作者:Jacob Andreas、Dan Klein、Sergey Levine
单位:加州大学伯克利分校

摘要:我们描述了一个以policy sketches为指导的多任务深入增强学习的框架。sketches用指定的子任务序列标注任务,提供关于任务之间的高级结构关系的信息,但不是如何实现它们 —— 具体来说,不提供强化学习之前的学习策略抽象工作所使用的详细指导(如中间奖励、子任务完成信号、内在动机)。为了从sketches中学习,我们提出一个将子任务与模块化子政策相关联的模型,并通过将每一个子任务和模块子策略结合起来,并通过在共享子策略之间测试参数,将全部任务特定的策略的奖励最大化。优化是通过解耦合actor-critic训练目标来实现的,这个目标可以帮助学习多个不相似的奖励功能的共同行为。我们评估我们的方法在具有离散和连续控制的三个环境中的有效性,以及仅在完成若干高级次级目标之后才能获得的稀少奖励。实验表明,使用我们的方法学习sketches,比现有的学习特定任务或共享策略的技术具有更好的表现,同时可以自然归纳出可重新组合的可解释的原始行为库,以快速适应新任务。

下载地址:http://proceedings.mlr.press/v70/andreas17a/andreas17a.pdf

论文:A Unified Maximum Likelihood Approach for Estimating Symmetric Properties of Discrete Distributions
作者:Jayadev Acharya、Hirakendu Das、Alon Orlitsky、Ananda Suresh
单位:康奈尔大学、雅虎等

摘要:许多应用中都出现了对称分布特性,例如支持大小、支持覆盖率、熵值和均匀性等。最近,研究人员应用了不同的估计量和分析工具,来为每个属性推导渐进的样本最优近似。我们的研究表明,单一、简单、插件式的估计量:profile maximum likelihood (PML),是可以与所有对称属性竞争的样本,特别是对于上述所有属性,PML最优。

下载地址:http://proceedings.mlr.press/v70/acharya17a/acharya17a.pdf

最具时间价值奖(Test of Time Award)

论文:Combining Online and Offline Knowledge in UCT
作者:Sylvain Gelly、David Silver
单位:巴黎南大学、阿尔伯塔大学

摘要:UCT算法使用基于样本的搜索在线学习价值函数。TD(λ) 算法可以为策略分布离线学习一个价值函数。我们在UCT算法中考虑了三种离线和在线价值函数的组合。第一种,在蒙特卡洛模拟中使用离线价值函数作为默认策略。第二种,UCT价值函数与快速在线action values评估相结合。第三,离线价值函数作为UCT搜索树的先验知识。我们通过在9×9规格围棋盘上对阵GnuGo 3.7.10来评估这些算法。第一种算法的表现,由于使用随机模拟策略的UCT,但是令人意外的比使用手工模拟策略的UCT算法要差。第二种算法全面优于UCT。第三种算法表现优于使用手工先验知识的UCT算法。我们在MoGo(世界最强9×9围棋程序)中结合了这三种算法。每一种算法都显著改善了MoGo的棋力。

下载地址:http://www.machinelearning.org/proceedings/icml2007/papers/387.pdf

最具时间价值奖提名:

论文:Pegasos: Primal Estimated sub-GrAdient SOlver for SVM
地址:http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf

论文:A Bound on the Label Complexity of Agnostic Active Learning

下载地址:http://www.machinelearning.org/proceedings/icml2007/papers/375.pdf

本文作者:允中
原文发布时间: 2017-08-07
相关文章
|
7月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
2月前
|
机器学习/深度学习 搜索推荐 算法
机器学习-点击率预估-论文速读-20240916
机器学习-点击率预估-论文速读-20240916
36 0
|
7月前
|
机器学习/深度学习 分布式计算 算法
机器学习PAI常见问题之下载了很多版本依赖包导致超时如何解决
PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。
|
4月前
|
机器学习/深度学习 存储 人工智能
【ACL2024】阿里云人工智能平台PAI多篇论文入选ACL2024
近期,阿里云人工智能平台PAI的多篇论文在ACL2024上入选。论文成果是阿里云与阿里集团安全部、华南理工大学金连文教授团队、华东师范大学何晓丰教授团队共同研发。ACL(国际计算语言学年会)是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台PAI在自然语言处理和多模态算法、算法框架能力方面研究获得了学术界认可。
|
5月前
|
机器学习/深度学习 人工智能 分布式计算
阿里云人工智能平台PAI论文入选OSDI '24
阿里云人工智能平台PAI的论文《Llumnix: Dynamic Scheduling for Large Language Model Serving》被OSDI '24录用。论文通过对大语言模型(LLM)推理请求的动态调度,大幅提升了推理服务质量和性价比。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
|
4月前
|
机器学习/深度学习 数据采集 自然语言处理
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4 机器学习LGB 方案
在讯飞英文学术论文分类挑战赛中使用LightGBM模型进行文本分类的方案,包括数据预处理、特征提取、模型训练及多折交叉验证等步骤,并提供了相关的代码实现。
53 0