少样本学习系列(三)【Optimization-Based Methods】

简介: 少样本学习系列(三)【Optimization-Based Methods】

大多数深度学习算法都采用基于梯度的方法做优化,但是这种方式需要大量的sample来更新算法,元学习(learn to learn)算法主要是解决算法如何在任意的loss function下收敛,而不是单个taskloss function。这样的算法提取的是更高层次的信息。

  在基于梯度的优化算法里面,如果我们通过某种方式知道了整个的概率分布,那么就可以通过很少次迭代得到最优的那个值,但是因为现在的算法大部分时间都在期望网络自己通过数据去学这个分布,因此就会比较慢。这也正是optimization-based算法来解决的问题。


Model-agnostic meta-learning (MAML)


  Model-agnostic meta-learning (MAML)通过为每个task提供一个更好的初始化参数来做到这件事情。如何做到这件事情呢?一种方式是在不同的tasktrain网络,当给定一个新的task时,此时的网络就已经有个一个较好的初始化参数了,因此很少的迭代次数就能有较好的效果。

  如上图所示实线θ \thetaθ表示为meta learning学习得到的初始化参数,然后对应不同的task,就能够很快地适应找到对应task的参数,如虚线所示。

  model-agnostic meta-learning可以被用到任意的一种model算法中,像分类、回归、强化学习等。

  假设我们想要依据MAML做一个分类模型f θ ,步骤如下:

image.png

 这种方式比Siamese networksmatching networksmemory-augmented neural networksOmniglotmini-ImageNet的效果都要好。


LSTM Meta-Learner


  LSTM Meta-Learner训练一个LSTM学习如何更新。

  常见的梯度更新方式为:


image.png


 其中θ t是在时刻t tt的参数,∇ L t 是在时刻t ttloss梯度,α t是时刻t 的学习率。

  LSTM cell的更新方式为:

image.png


cell-update equationgradient descent update很像,可以看作:


image.png

LSTM meta-learner algorithm

image.png


 算法结构如下图所示:



相关文章
|
机器学习/深度学习 开发框架 .NET
YOLOv5的Tricks | 【Trick6】学习率调整策略(One Cycle Policy、余弦退火等)
YOLOv5的Tricks | 【Trick6】学习率调整策略(One Cycle Policy、余弦退火等)
1773 0
YOLOv5的Tricks | 【Trick6】学习率调整策略(One Cycle Policy、余弦退火等)
|
10天前
|
vr&ar
R语言如何做马尔可夫转换模型markov switching model
R语言如何做马尔可夫转换模型markov switching model
|
8月前
|
机器学习/深度学习 数据采集 计算机视觉
少样本学习系列(一)【Metrics-Based Methods】
少样本学习系列(一)【Metrics-Based Methods】
|
8月前
|
机器学习/深度学习 算法 网络架构
少样本学习系列(二)【Model-Based Methods】
少样本学习系列(二)【Model-Based Methods】
|
8月前
|
机器学习/深度学习 自然语言处理 索引
GTEE-DYNPREF: Dynamic Prefix-Tuning for Generative Template-based Event Extraction 论文解读
我们以基于模板的条件生成的生成方式考虑事件抽取。尽管将事件抽取任务转换为带有提示的序列生成问题的趋势正在上升,但这些基于生成的方法存在两个重大挑战
75 0
|
8月前
|
算法
Single TPR论文解读
Single TPR是2015年提出来的,是基于TPR的进一步改进,TPR论文解读可以参考Topical PageRank(TPR)论文解读_Trouble…的博客-CSDN博客。
69 0
|
11月前
|
机器学习/深度学习 SQL 人工智能
Prompt工程师指南[高阶篇]:对抗性Prompting、主动prompt、ReAct、GraphPrompts、Multimodal CoT Prompting等
Prompt工程师指南[高阶篇]:对抗性Prompting、主动prompt、ReAct、GraphPrompts、Multimodal CoT Prompting等
|
算法 数据挖掘 计算机视觉
YOLOv5的Tricks | 【Trick5】遗传算法实现超参数进化(Hyperparameter Evolution)
YOLOv5的Tricks | 【Trick5】遗传算法实现超参数进化(Hyperparameter Evolution)
668 0
YOLOv5的Tricks | 【Trick5】遗传算法实现超参数进化(Hyperparameter Evolution)
|
机器学习/深度学习 算法 PyTorch
目标检测的Tricks | 【Trick12】分布式训练(Multi-GPU)与DistributedParallel使用相关总结
目标检测的Tricks | 【Trick12】分布式训练(Multi-GPU)与DistributedParallel使用相关总结
254 0
目标检测的Tricks | 【Trick12】分布式训练(Multi-GPU)与DistributedParallel使用相关总结
|
存储 机器学习/深度学习 编解码
目标检测的Tricks | 【Trick2】自动混合精度(Automatic mixed precision)
目标检测的Tricks | 【Trick2】自动混合精度(Automatic mixed precision)
240 0