开学季,你要的激活函数都在这里

简介: 激活函数就是神经网络输出端的一个节点,来连接两个神经网络。激活函数都有哪些类型?让我们继续阅读。

什么是激活函数?

激活函数是神经网络输出端的一个节点,来连接两个神经网络。

为什么要在神经网络中使用激活函数

激活函数用来确定神经网络的输入,比如,将结果映射为[01][-11]之间,根据函数的曲线,可分为两种类型:线性激活函数非线性激活函数

1.线性激活函数(恒等激活函数)

如下图所示,函数是线性的,函数的输出范围为(-∞+∞)。

 37e3a7e445dc8ce8874366d6d54a0f961a8b3ecb

线性激活函数

方程式:f(x) = x

取值范围:(-∞+∞

2.非线性激活函数

非线性激活函数是最常用的激活函数,其曲线如下图所示:

 6d17f199183d34da12a4b695f74d7a45475f13d3

非线性激活函数

使用非线性激活函数,模型可以更容易进行自我调整,并区分不同的输出。非线性激活函数的主要术语有:

1.导数或微分:y轴随x轴的变化,称为斜率。

2.单调函数:完全递增或完全递减的函数。

根据取值范围,非线性激活函数可分为以下几种:Sigmoid激活函数Tanh激活函数ReLU激活函数

1.Sigmoid激活函数(Logistic激活函数)

Sigmoid激活函数的曲线“S”形。

997d59c549722f820c46b4ff6da845f0984045f2 

Sigmoid激活函数

sigmoid函数很受大众的欢迎,其主要原因是:它的输出处于[0,1]范围内,特别适用于输出概率的模型。由于任何概率的取值在01范围之间,因此,sigmoid激活函数是最好的选择。

该函数是可微的,也就是说,我们可以得到“S”曲线上任意两点之间的斜率。这个函数是单调的,但是其导数不是,sigmoid 激活函数可能会导致神经网络在训练的时候卡住。

softmax函数是一种更通用的逻辑激活函数,用于多类分类。

2.Tanh激活函数

tanh激活函数和sigmoid激活函数类似,但是要比sigmoid激活函数好。tanh激活函数的取值范围是(-1,1),曲线也“S”形。

  18d711f82265cc6d1feeb28eb19b0ab74e123f7f

sigmoid激活函数和tanh激活函数

tanh激活函数的优点在于,如果输入为负数,则输出也为负数,输入为0,则输出也近似为0

该函数是可微分、单调的,但其导数不单调。tanh激活函数主要用于分类。

tanhsigmoid激活函数都可用于前馈网络。

3.ReLU激活函数(Rectified Linear Unit)

在神经网络中,使用最多的激活函数是ReLU激活函数,它几乎可用于所有卷积神经网络或深度学习中。

 49744437ef17aabd5ee75268856ba7cfaedb6fc9 

ReLU激活函数和Sigmoid激活函数

如上图所示,在ReLU激活函数中,当z<0时,f(z)=0;当z>0时,f(z)=z。取值范围[0,+∞]

ReLU激活函数及其导数都是单调的。

存在一个问题:当输入为负值时,输出立刻变为0,这就降低了模型拟合或训练数据的能力。反过来说,为了不影响结果,就不能映射负值输入

4. Leaky ReLU激活函数

Leaky ReLU激活函数的出现,试图解决ReLU激活函数中出现的死亡问题。

7c5029b3695caad4e6b8a5c4a4cbd88fc822b793 

 ReLU激活函数和Leaky ReLU激活函数

Leaky ReLU激活函数扩大了ReLU激活函数的取值范围,如上图所示,通常,a的值为0.01左右。取值范围:(-∞+∞

a不是0.01时,该函数称为Randomized ReLU

本质上来说,Leaky  ReLU函数和Randomized ReLU函数都是单调的。 而且,它们的导数也单调。

为什么要使用导数和微分?

在更新曲线时,我们要知道哪个方向上会发生变化,或者是根据斜率来更新曲线。这就是我们要在机器学习和深度学习的每个部分都使用微分的原因。

 8cb354660065f98f2ef2e2fecb8d4d2c95a4cb5d 

激活函数汇总

2a18320dc2d5ebc0893a1f32ed7a1d18fb5d843d 

激活函数的导数曲线图汇总

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Activation Functions Neural Networks

译者:Mags,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关文章
|
容器
天梯赛备战(三)
天梯赛备战(三)
|
存储 iOS开发 容器
天梯赛备战(二)
天梯赛备战(二)
|
存储 编译器 C++
天梯赛备战(一)c++
天梯赛备战(一)c++
109 0
|
算法 C语言 C++
开学前学习(女娲补天 精卫填海)计划
2023 2 1 至 开学前学习(女娲补天 精卫填海)计划 编辑这篇博客时间到开学还有18天,自从回来了福建老家之后就没有怎么学过习如何在开学前恢复好自己的学习状态以及更好的充实自己的能力,特写下此篇计划来督促和总理自己的学业。
124 0
|
供应链 前端开发 物联网
面试周连续剧之尘埃落定
通过前面五天的辛勤付出,最终换来了收获的回报,拿到的offer数量还是比较喜人的,虽然自己也不是什么技术大咖,水平也是平平,但是得到了老天的眷顾,让我在找工作的时候没有遇到太多的砍,总体上还是比较顺风顺水的。本文就来分享一下自己如何选择拿到的这些offer,以及最终做出最后的选择的原因。
208 1
面试周连续剧之尘埃落定
|
机器学习/深度学习 人工智能 算法
2021-2022年度第三届全国大学生算法设计与编程挑战赛(秋季赛)G.希望(组合数学 bfs)
2021-2022年度第三届全国大学生算法设计与编程挑战赛(秋季赛)G.希望(组合数学 bfs)
256 0
2021-2022年度第三届全国大学生算法设计与编程挑战赛(秋季赛)G.希望(组合数学 bfs)
|
算法
2021-2022年度第三届全国大学生算法设计与编程挑战赛(秋季赛)热身赛 B.这是一道大水题(树状数组)
2021-2022年度第三届全国大学生算法设计与编程挑战赛(秋季赛)热身赛 B.这是一道大水题(树状数组)
163 0
2021-2022年度第三届全国大学生算法设计与编程挑战赛(秋季赛)热身赛 B.这是一道大水题(树状数组)
L1-079 天梯赛的善良 (20 分)
L1-079 天梯赛的善良 (20 分)
224 0
7-7 天梯赛的善良 (20 分)
7-7 天梯赛的善良 (20 分)
288 0
|
存储 算法 容器
天梯赛二阶题——L2-015 互评成绩(25 分)
学生互评作业的简单规则是这样定的:每个人的作业会被k个同学评审,得到k个成绩。系统需要去掉一个最高分和一个最低分,将剩下的分数取平均,就得到这个学生的最后成绩。本题就要求你编写这个互评系统的算分模块。
372 0
天梯赛二阶题——L2-015 互评成绩(25 分)