备案控制台

开发者社区人工智能文章正文

【CS224n】(assignment3)Adam和Dropout

2022-04-27 117

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 各类深度学习的优化算法的演变过程：SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 这样的历程。优化算法的框架：

零、各类优化算法

0.1 框架梳理优化算法

各类深度学习的优化算法的演变过程：SGD -> SGDM -> NAG ->AdaGrad -> AdaDelta -> Adam -> Nadam 这样的历程。

优化算法的框架：

首先定义：待优化的参数为w，目标函数为f(w)，初始的学习速率为 α \alphaα，现在要开始迭代优化，在每个epoch t中：

一、Adam

（1）回顾随机梯度下降SGD：

2.2 问题2

问题2：为啥在训练时加入dropout，而在测试阶段不用加入dropout？

答：dropout是一种正则化技术。在训练过程中，模型参数在不退出的情况下容易对某些特征进行过拟合，且相邻参数之间存在高度依赖性。在这种情况下，模型是脆弱和过度拟合的，不能处理分布外的未见数据。Dropout可以在训练过程中通过消零梯度来随机切断参数(权重)之间的连接。因此，dropout可以降低参数之间的依赖程度，使训练后的模型具有更好的鲁棒性和泛化能力。在评估过程中，我们需要参数和一致输出之间的所有连接，所以不需要使用dropout。

文章标签：

机器学习/深度学习

算法

山顶夕景

目录

相关文章

JOYCE_Leo16

|

7月前

|

机器学习/深度学习资源调度监控

PyTorch使用Tricks：Dropout，R-Dropout和Multi-Sample Dropout等！！

PyTorch使用Tricks：Dropout，R-Dropout和Multi-Sample Dropout等！！

JOYCE_Leo16

118 0 0

BetterBench

|

4月前

|

TensorFlow API 算法框架/工具

【Tensorflow】解决Inputs to eager execution function cannot be Keras symbolic tensors, but found [＜tf.Te

文章讨论了在使用Tensorflow 2.3时遇到的一个错误："Inputs to eager execution function cannot be Keras symbolic tensors..."，这个问题通常与Tensorflow的eager execution（急切执行）模式有关，提供了三种解决这个问题的方法。

BetterBench

53 1 1

iamzfh

|

6月前

|

机器学习/深度学习算法关系型数据库

Hierarchical Attention-Based Age Estimation and Bias Analysis

【6月更文挑战第8天】Hierarchical Attention-Based Age Estimation论文提出了一种深度学习方法，利用层次注意力和图像增强来估计面部年龄。通过Transformer和CNN，它学习局部特征并进行序数分类和回归，提高在CACD和MORPH II数据集上的准确性。论文还包括对种族和性别偏倚的分析。方法包括自我注意的图像嵌入和层次概率年龄回归，优化多损失函数。实验表明，该方法在RS和SE协议下表现优越，且在消融研究中验证了增强聚合和编码器设计的有效性。

iamzfh

51 2 2

YuetianW

|

机器学习/深度学习 PyTorch 算法框架/工具

# Pytorch 中可以直接调用的Loss Functions总结：（二）

# Pytorch 中可以直接调用的Loss Functions总结：（二）

YuetianW

169 0 0

# Pytorch 中可以直接调用的Loss Functions总结：（二）

rothschild666

|

PyTorch 算法框架/工具图计算

Pytorch中autograd.Variable.backward的grad_varables参数个人理解浅见

Pytorch中autograd.Variable.backward的grad_varables参数个人理解浅见

rothschild666

138 0 0

Pytorch中autograd.Variable.backward的grad_varables参数个人理解浅见

HanZee

|

机器学习/深度学习 PyTorch 算法框架/工具

Batch Normlization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》论文详细解读

Batch Normlization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》论文详细解读

HanZee

130 0 0

Batch Normlization: Accelerating Deep Network Training by Reducing Internal Covariate Shift》论文详细解读

YuetianW

|

PyTorch 算法框架/工具

Pytorch Loss Functions总结

Pytorch Loss Functions总结

YuetianW

173 0 0

YuetianW

|

PyTorch 算法框架/工具

# Pytorch 中可以直接调用的Loss Functions总结：（三）

# Pytorch 中可以直接调用的Loss Functions总结：（三）

YuetianW

634 0 0

YuetianW

|

PyTorch 算法框架/工具

# Pytorch 中可以直接调用的Loss Functions总结：（一）

# Pytorch 中可以直接调用的Loss Functions总结：（一）

YuetianW

159 0 0

皮卡丘敲级可爱

|

机器学习/深度学习算法数据挖掘

【论文泛读】 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

【论文泛读】 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

皮卡丘敲级可爱

254 0 0

【论文泛读】 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

热门文章

最新文章

基于区块链的机器学习模型创建方案

阿里云服务器ECS搭建个人网站新手教程（超详细）

上云，你需要了解的账号管理模型

RDS入门——Excel文件转存到RDS数据库实践

优秀的代码都是如何分层的？

3、Python与设计模式--建造者模式

跟阿里云技术专家阙寒一起深度了解视频直播CDN技术

当人工智能遇上区块链，会发生什么？

力挑VMWare 红帽推新虚拟化技术

Ext 4 概述（七）之面板Panel & 杂项

【算法】——快排，分治算法合集

【Spring】方法注解@Bean，配置类扫描路径

【算法】栈

【Spring】获取Bean对象需要哪些注解

【Spring】IoC和DI，控制反转，Bean对象的获取方式

【SpringBug】lombok插件失效，但是没有报错信息，@Data不能生成get和set方法

【SpringMVC】应用分层

【Spring项目】图书管理系统

【Spring配置】idea编码格式导致注解汉字无法保存

【算法】模拟

相关电子书

更多

Analysis of dropout learnning

Analysis of dropout lcarning r

Visualization of Enhanced Spark Induced Naïve Bayes Classifier

下一篇

手把手教你白嫖阿里云服务器(免费领服务器)