开发者社区> 藏经阁> 详情

Understanding and Improving Layer Normalization论文

343 55

作者：藏经阁小助手

状态：完结

发布时间：2020-07-27

章节数：1

10.0

（70人评分）评价这本书

点击下载

在线阅读

343次

在线阅读

55次

下载

技术作品介绍

继 BN 之后，学术界提出了 LN，针对的是 RNN 模型，后来科研人员发现 LN 对于基于自注意力的模型非常有效。典型的例子就是 LN 在 Transformer 中的大量使用。LN 帮助更快地训练 Transformer 模型。然而，LN 的成功一直是个疑问。一种解释是前向归一化提升了分布的稳定性，但最新研究则表明 BN 的效果和输入分布的稳定性没有关系，而是让优化的损失更加平滑。

作者信息

藏经阁小助手

版权信息

排行榜

总阅读榜

总下载榜

Understanding and Improving Layer Normalization论文

技术作品介绍

作者信息

热门书评

相关技术作品

智创“她”力量：女性AI创新创业白皮书

中企出海云计算技术服务白皮书

AI 原生应用开发实战营·深圳站分享材料

AI云采用框架白皮书（导读版）

AgentScope Java v1.0 正式发布

版权信息

排行榜

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Understanding and Improving Layer Normalization论文

技术作品介绍

作者信息

热门书评

相关技术作品

智创“她”力量：女性AI创新创业白皮书

中企出海云计算技术服务白皮书

AI 原生应用开发实战营·深圳站分享材料

AI云采用框架白皮书（导读版）

AgentScope Java v1.0 正式发布

版权信息

排行榜