少样本学习系列(三)【Optimization-Based Methods】-阿里云开发者社区

少样本学习系列(三)【Optimization-Based Methods】

2023-08-05 143

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 少样本学习系列(三)【Optimization-Based Methods】

大多数深度学习算法都采用基于梯度的方法做优化，但是这种方式需要大量的sample来更新算法，元学习(learn to learn)算法主要是解决算法如何在任意的loss function下收敛，而不是单个task的loss function。这样的算法提取的是更高层次的信息。

在基于梯度的优化算法里面，如果我们通过某种方式知道了整个的概率分布，那么就可以通过很少次迭代得到最优的那个值，但是因为现在的算法大部分时间都在期望网络自己通过数据去学这个分布，因此就会比较慢。这也正是optimization-based算法来解决的问题。

Model-agnostic meta-learning (MAML)

Model-agnostic meta-learning (MAML)通过为每个task提供一个更好的初始化参数来做到这件事情。如何做到这件事情呢？一种方式是在不同的task上train网络，当给定一个新的task时，此时的网络就已经有个一个较好的初始化参数了，因此很少的迭代次数就能有较好的效果。