文档备案控制台

开发者社区问答正文

深度学习做回归问题，需要对数据做标准化吗？输出层是否需要激活函数？

1、一些 Paper 会将数据做 min-max normalization 或者 z-score normalization，然后在输出层可能会用 tanh（对应缩放到 [-1, 1]）或者 sigmoid（缩放到 [0, 1]）。然而有人认为做 Regression 问题，输出层不需要任何激活函数。到底哪种做法更合理呢？

2、我在复现某篇 Paper 的模型时，就发现一个问题，该模型将数据缩放到 [-1, 1]，输出层用的是 tanh。然而在我的数据上，由于大部分原始数据值接近于最小值，缩放后接近于 -1，恰好是 tanh 没有梯度的区域，因此 tanh 的训练效率特别慢。如果去除输出层的激活函数，有一个奇怪的现象：
a）如果使用原始数据（不进行任何数据标准化），收敛正常；
b）如果缩放到 [-1, 1] 或者 [0, 1]，很难收敛，Loss 一直在震荡；
然而我的理解，它们之间只有数量级的差异（好比最小值为 0 的原始数据统一除以最大值，就缩放成了 [0, 1]），为什么会导致这种反差现象呢？

3、如果在模型中用到 BatchNorm、LayerNorm 等，是否就必须对输入输出的数据做标准化了？

展开

收起

游客lap4oyjrfbxm4 2019-07-19 22:45:37 9367 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

khachapuri

需要考虑浮点数精度。

2020-03-19 22:56:15

赞同展开评论
被纵养的懒猫

BN是在当前层最后进行处理的，原始数据还是要经过至少一层的网络，在这一层网络中不同的数据规模和范围肯定会有影响，BN在后面会有所矫正，但是问题避免不了，所以还需要做标准化。 onvolution layer需要激活函数 pooling layer需要激活函数 normalization layer不需要激活函数 fully-connected layer需要激活函数 cost layer不需要激活函数

答案来源于网络

2019-09-24 20:10:06

赞同展开评论

问答标签：

深度学习函数深度学习数据深度学习激活函数深度学习数据标准化

问答地址：

开发者社区 > 云计算 > 问答

相关问答

我的函数代码中统计了一个深度学习模型加载的时间，一个大小为13M的模型利用torch加载模型并传递到

597

2

0

深度学习如果做BN处理的话，原始数据还需要做归一化或者标准化吗

4673

2

0

容器服务深度学习怎么创建数据卷

2428

0

0

深度学习平台能否读取.h5格式的数据

4413

2

0

机器学习PAI有没有适合用于特定领域的意图识别和插槽填充的深度学习教程呀?

433

1

0

机器学习深度学习相关组件报错没有GPU资源

228

1

0

1.可以简单的认为“深度学习”就是“机器学习”的一个分支吗？

158

1

0

深度学习和机器学习有什么关联或者关系吗？

237

1

0

tinyDL中，机器学习的通用组件与深度学习是如何处理的？

235

1

0

机器学习算法和深度学习的区别？

282

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

通义灵码提示格式问题

notebook启动安全验证一直失败

MacBook端Clion编辑器的通义灵码代码自动补全功能失效

vllm部署模型，参数如何指定

怎么在cursor上使用mcp来采集网页数据，听说brightdata-mcp适合做爬虫，好用吗？

还有其他疑问?