ICML 上有19场 DeepMind的论文演讲,多到看不过来了 | ICML 2017

简介:

雷锋网 AI 科技评论按:ICML 2017马上就要在悉尼举行了。ICML (International Conference on Machine Learning)与每年年底举行的NIPS(Conference on Neural Information Processing Systems)是机器学习与人工智能研究领域影响力极高的两个主要会议,另外上半年举行的 ICLR(International Conference on Learning Representations)也有后来居上的趋势。

ICML 2017的会议时间是8月6日到8月11日,悉尼的跟北京的时差也仅仅有两个小时而已,所以很快就要到了。其实 ICML 2017 接收论文名单早在5月就公布了,不过 DeepMind 还是想提醒参会者们关注一下自己的论文,所以今天在自己研究 blog 上发出了一份论文演讲清单。

这份清单中一共有 19 篇论文,也就是 19 个论文演讲,其实 DeepMind 在此届 ICML 上收录的论文本来也有25篇之多。一个 19 篇论文的清单太长了,以至于 DeepMind 都把这份清单分成了3篇来发。

论文这么多,雷锋网 AI 科技评论这里为大家简单介绍其中3篇。

Sharp Minima Can Generalize For Deep Nets

  • 深度神经网络中尖锐的最小值也可以让模型具有泛化能力

  • 论文作者:Laurent Dinh (Univ. Montreal), Razvan Pascanu, Samy Bengio (Google Brain), Yoshua Bengio (Univ. Montreal)

  • 论文简介:虽然深度学习架构的过拟合能力强得过头了一点,不过它们对于全新数据的泛化能力还是相对不错的,这样就可以用它们来解决一些实际问题。然而,解释这种状况背后的机理仍然是研究中的一个富有开放性的问题。有一种假设最近得到了越来越多的关注,就是基于随机梯度的方式找到的损失函数的最小值,它的平滑度越高,模型的泛化性能就越高。这篇论文提出了这样的观点:多数关于平滑度的想法对于深度神经网络都不贴切,而且没办法直接用来解释泛化性。具体讨论带有激活函数的深度神经网络的话,可以得出由继承对称性引出的这些网络架构的参数空间的特定几何结构,利用这些几何结构可以构建出跟任意更尖锐的最小值等效的模型。更进一步地,如果允许对一个函数重新参数化,它的参数几何结构可以大幅度变化,但并不影响它的泛化属性。

  • 论文地址:https://arxiv.org/abs/1703.04933 

  • 论文演讲:Monday 07 August, 11:06-11:24 @ C4.8 

  • 海报地址:Tuesday 08 August, 18:30-22:00 @ Gallery #3

Learning to learn without gradient descent by gradient descent

  • 无需梯度下降的梯度下降,学会一个会学习的模型

  • 论文作者:Yutian Chen, Matthew Hoffman, Sergio Gomez, Misha Denil, Timothy Lillicrap, Matthew Botvinick , Nando de Freitas(全部都是 DeepMind 英国团队成员)

  • 论文简介:借助梯度下降的方法,可以用简单的生成函数训练,学到循环神经网络(RNN)优化器。可以表明,这些学到的优化器展现出了相当高的迁移能力,它们可以用来高效地优化很多种不可导的“黑盒”函数,包括 bandit 环境下的高斯过程、简单控制对象、全局优化benchmark和超参数调节任务。在训练层面上,学到的优化器可以学会在应用和探索中找到平衡,并且根据自己的偏好在高度工程化的贝叶斯优化方法集中选择适合做超参数调节的方法。

  • 论文地址:https://arxiv.org/abs/1611.03824 

  • 论文演讲:Monday 07 August, 17:15-17:33 @ Darling Harbour Theatre

  • 海报地址:Tuesday 08 August, 18:30-22:00 @ Gallery #6

  • 雷锋网(公众号:雷锋网) AI 科技评论注:这篇论文的名字很有特点,而且论文一作也是华人,我们已经叮嘱了前方记者特别关注一下,请期待我们的好消息

Neural Audio Synthesis of Musical Notes with WaveNet Autoencoders

  • 用 WaveNet 自动编码器神经网络生成乐音

  • 论文作者:Sander Dieleman, Karen Simonyan, Jesse Engel (Google Brain), Cinjon Resnick (Google Brain), Adam Roberts (Google Brain), Douglas Eck (Google Brain), Mohammad Norouzi (Google Brain)

  • 论文简介:在算法进步和高质量图像数据集这两个因素的帮助下,视觉方面的生成式模型已经得到了快速的发展。这篇论文为音频领域的这两个因素都做出了贡献,以便音频模型也可以有更大的发展空间。首先,作者们详细介绍了一个优越的新型 WaveNet 样式的自动编码器模型,它对应着一个能从原始音频波形学到临时编码的自回归解码器。其次,作者们介绍了 NSynth,这是一个大规模、高质量的音乐数据集,它比现有的公开数据集规模要大一个数量级。借助 NSynth,论文中展现出,相比一个完善优化过的频谱自动编码器基准模型, WaveNet 自动编码器在定量和定性表现上都有提高。最后,论文表明这个模型可以学到多种embedding,从而可以在乐器之间转化、在音色中做有意义的插值,创造出真实动人的新的类型的声音。

  • 论文地址:https://arxiv.org/abs/1704.01279 

  • 论文演讲:Tuesday 08 August, 14:42-15:00 @ Parkside 1

  • 海报地址:Tuesday 08 August, 18:30-22:00 @ Gallery #98

其它 16 篇演讲论文

对后16篇论文演讲时间和海报地点感兴趣的读者,可以访问 DeepMind 原博具体查看。这里是论文清单3篇里第一篇的地址,在文末有指向另外两篇的链接。

不能亲临 ICML 2017 的读者,可以先看看以上的论文,并期待我们的会议相关报道;能够到现场的呢,雷锋网 AI 科技评论就跟你们现场见!

相关文章:

刘铁岩团队ICML论文提出机器学习的新范式:对偶监督学习

科技公司争相涌进ICML 2017,论文数占1/4,Google独占6.3%

本文作者:杨晓凡

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
11月前
|
机器学习/深度学习 生物认证 语音技术
声纹识别入门:原理与基础知识
【10月更文挑战第16天】声纹识别(Voice Biometrics)是生物特征识别技术的一种,它通过分析个人的语音特征来验证身份。与指纹识别或面部识别相比,声纹识别具有非接触性、易于远程操作等特点,因此在电话银行、客户服务、智能家居等领域得到了广泛应用。
1848 0
|
定位技术 C++ Python
ArcMap软件卡在加载界面且闪退无法打开的多种解决办法
ArcMap软件卡在加载界面且闪退无法打开的多种解决办法
680 1
|
算法 程序员
程序员可能越来越排斥面试时做题的原因
程序员可能越来越排斥面试时做题的原因
358 1
|
IDE Java 开发工具
阿里巴巴Java开发规约-插件使用[Idea和Eclipse]
阿里巴巴基于手册内容,研发了一套自动化的IDE检测插件(IDEA、Eclipse)。该插件在扫描代码后,将不符合规约的代码按Blocker(命名不符合规范)/Critical/Major三个等级显示在下方,甚至在IDEA上,我们还基于Inspection机制提供了实时检测功能,编写代码的同时也能快速发现问题所在。对于历史代码,部分规则实现了批量一键修复的功能,如此爽心悦目的功能是不是很值得拥有?提升代码质量,提高团队研发效能,插件将会一路同行。
阿里巴巴Java开发规约-插件使用[Idea和Eclipse]
|
Prometheus 监控 Cloud Native
基于prometheus 实现exporter新增监控指标
基于prometheus 实现exporter新增监控指标
577 0
教你如何免费领取云服务器—–详细讲解
今天我来和大家讲讲免费阿里云云服务器都有哪些?哪些阿里云产品可以让我们去免费申请使用?
2980 0
教你如何免费领取云服务器—–详细讲解
|
自然语言处理 开发工具 开发者
阿里云自然语言处理 .NET 使用示例
阿里云自然语言处理(Natural Language Processing)是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文化娱乐、金融、物流等行业客户的多项业务中,取得了良好的效果。
3911 0
阿里云自然语言处理 .NET 使用示例