自动选模型+调参:谷歌AutoML背后的技术解析-阿里云开发者社区

开发者社区> 开发者小助手-bz8> 正文

自动选模型+调参:谷歌AutoML背后的技术解析

简介: AutoML 是 Google 最新的产品,能够根据问题自动确定最优参数和网络结构。本文章就关注解析 AutoML 背后的技术,由于 AutoML 缺乏技术文档,我们的解析有不到之处,还请多多更正。
+关注继续查看

罗马不是一天建成的。AutoML 并非一蹴而就,而是 Google 的研究者在过去几年不断思考中产生的理论与实践结合的完美产物。下图是 Google 的 AutoML 探索之路。

 

微信图片_20211129154606.jpg


人工网络结构搜索(Inception-ResNet 与 Inception V4)


Alexnet 在 IMAGENET 取得冠军之后,Google 意识到了深度学习是未来的趋势,于是投入巨资进行神经网络的研究。从 Deepmind 被收购,Hinton 加入 Google,Tensorflow 的开源中可见 Google 对于 Deep Learning 的重视与远见。Google 在不断的调参数中发现了著名的 Inception 网络,并且结合 ReNet,发现了 Inception-ResNet,V4 和 Xception。这些发现让 Google 注意到了神经网络结构会对结构产生巨大影响,但是找到最优的结构需要耗费大量的人力和物力,并且对于一个新的数据集还需要投入同样的资源搜索合适的结构,这样的人工搜索是不能够 scalable 的。Inception-ResNet 的网络结构请参考论文:https://arxiv.org/pdf/1602.07261.pdf。Inception 系列网络跟 ResNet 的结果比较。


微信图片_20211129154603.jpg


神经网络搜索初探:Neural Architecture Search with Reinforcement Learning(ICLR 2017 Best Paper)


为了增加网络结构搜索的 scalability,Google Residency Program 的成员 Barrret Zoph 在 Quoc Le 的带领下开始了神经网络自动调参的尝试,Neural Architecture Search with Reinforcement Learning 就是对这一工作的总结。该论文获得了 ICLR 2017 的 Best Paper。Barret Zoph 的工作成功在 CIFAR 和 PTB 上面搜索到了 state-of-the-art 的 CNN 和 LSTM 结构,最优 CNN 与 LSTM 结构对比如下:


微信图片_20211129154600.jpg

Barret Zoph 使用强化学习进行网络结构搜索,网络框架图如下图:

 

微信图片_20211129154557.jpg

Controller 是由 RNN 构成能够产生每层网络的 Kernel 大小和 skip connection 的连接,产生了网络结构之后,使用网络结构的准确率作为 Reward function。Controller 会根据 reward function 的反馈进行网络结构调节,最后会得到最优的网络结构。Controller 生成网络结构预测如下图:

 

微信图片_20211129154554.jpg

本篇论文会对 controller 预测的网络进行 SGD 学习,网络收敛之后的准确率为 Reward,然后使用 reinforcement learning 的 policy gradient 进行 controller 权值更新,policy gradient 公式如下:

 

微信图片_20211129154551.jpg

期望值用下面的公式进行近似:


微信图片_20211129154549.jpg

为了保证训练稳定,引入了 baseline,公式如下:

 

微信图片_20211129154545.jpg

为了保证收敛速度,作者引入了 asynchronous 权值更新,在每个 GPU 中分配多个网络结构进行训练,跟 asynchronous reinforcement learning 的 idea 类似。该论文的 distribution 结构如下图:

 

微信图片_20211129154542.jpg


本篇论文能够避免手动调参数,但是得到网络搜索需要 800GPU 搜索几个月的时间,最近 Google 使用 P100 可以在一周左右训练出模型,本论文仅仅在 CIFAR 上面进行实验,在大规模数据集 IMAGENET 上面的使用受限。


Large Scale Evolution of Image Classifiers(ICML 2017)


本篇论文通过 large scale evolution 的办法来搜索最优的神经网络,由于本人能力有限,我们不对这篇论文进行技术解析。该论文的结构搜索过程如下图:

 

微信图片_20211129154539.jpg

有趣的现象是,evolution 搜索偏向于没有 skip connection 的神经网络。通过 evolution 办法搜索到的神经网络比 ResNet 结果好,但是低于 DenseNet,如下图:

 

微信图片_20211129154536.jpg

神经网络搜索技术实用之路探索


为了让结构搜索的工作能够实用,Google 的研究者从 progressive Search,Transferable architecture 和 Bayesian 的角度进行探索,并且取得了进展。


Progressive Neural Architecture Search(PNAS)


本篇论文提出了通过 progressive 的办法进行网络搜索,会比 RL 方法快 2 倍,比 evolution 方法快 5 倍。


与之前的方法不同,本篇论文是在一个网络的基础上面加上新的 cell,然后使用类似与 A*搜索(Branch and Bound)的办法,搜索到最优的网络结构。Progressive 方法示意图如下:

 

微信图片_20211129154532.jpg

PNAS 所使用的 Cell 结构如下:

 

微信图片_20211129154530.jpg


Learning Transferable Architecture for Scalable Image Recognition


本篇论文是集大成者,Barret Zoph 在之前全部技术的基础上面,成功地将自动结构搜索在 IMAEGNET,COCO 等实用性的物体分类和检测任务上面成功运用。结果太 AMAZING 啦。竟然超过了 ResNet-FPN,COCO 物体检测结果如下:

 

微信图片_20211129154525.jpg

微信图片_20211129154514.jpg


Barret Zoph 首先在 CIFAR 上面使用之前的方法搜索出最优 cell,然后将 cell 重复的运用在 IMAGENET 上面(真的就是这么简单有效 >_<)。最优单个 cell 的结构如下图:

 

微信图片_20211129154510.jpg

可能 AutoML 用的就是这种技术吧。


总结


Google 在大规模的调参中发现了手动调参不能够适应大数据时代的需求。于是进行从 reinforcement learning 和 evolution 两个角度进行了自动调参的初探。为了改进网络结构搜索的时间,Google 提出了 Progressive Search 和 Transferable Architecture 的办法。从中我们可以感受到 Google 一步一个脚印的做事方法,希望 AI 公司和个人都能够从中获得一些收益 >_<。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
飞天加速计划初体验
最近因需要使用云服务器来学习,老师让我们用这个阿里云类进行相关的学习,让我们先进行免费的使用进行学习,慢慢了解,毕竟对于首次接触的事物都是了解为主不会投入大量资金。阿里云平台有详细的教程,让初学者能十分轻松的进行学习。飞天加速计划是个好想法,可以让我们这些学生进行学习,制作出自己的网站。让我在暑假对计算机有了浓厚的兴趣,于是在阿里云我选择了飞天加速计划,学习大数据和服务器啥的,让自己get到更多的知识~
7 0
总结与回顾| 学习笔记
快速学习总结与回顾
4 0
文件通配符 | 学习笔记
快速学习文件通配符。
3 0
Vim 高级应用 | 学习笔记
快速学习 Vim 高级应用。
4 0
有监督学习算法(上)| 学习笔记
快速学习有监督学习算法(上)
3 0
有监督学习算法(下)| 学习笔记
快速学习有监督学习算法(下)
3 0
云计算大数据及人工智能| 学习笔记
快速学习云计算大数据及人工智能
7 0
总结与回顾(1)| 学习笔记
快速学习总结与回顾(1)
8 0
无监督学习算法(下)| 学习笔记
快速学习无监督学习算法(下)
8 0
文件查找和压缩 | 学习笔记
快速学习文件查找和压缩。
12 0
1654
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载