《深度学习》李宏毅 -- task4深度学习介绍和反向传播机制

2022-10-19 105

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Step1：神经网络（Neural network）Step2：模型评估（Goodness of function）Step3：选择最优函数（Pick best function）

深度学习的三个步骤

Step1：神经网络（Neural network）

Step2：模型评估（Goodness of function）

Step3：选择最优函数（Pick best function）

2.1 神经网络（Neural network）

神经网络（Neural network）里面的节点，类似我们的神经元。神经网络也可以有很多不同的连接方式，这样就会产生不同的结构（structure）在这个神经网络里面，我们有很多逻辑回归函数，其中每个逻辑回归都有自己的权重和自己的偏差，这些权重和偏差就是参数。

2.2 模型评估（Goodness of function）

损失示例：

对于模型的评估，我们一般采用损失函数来反应模型的好差，所以对于神经网络来说，采用交叉熵（cross entropy）函数来对y yy和y ^\hat{y}y^的损失进行计算。

总体损失：

对于损失，我们不单单要计算一笔数据的，而是要计算整体所有训练数据的损失，然后把所有的训练数据的损失都加起来，得到一个总体损失L。

2.3 选择最优函数（Pick best function）

我们使用梯度下降法去找最优函数和最好的一组参数。

反向传播

1.损失函数(Loss function)是定义在单个训练样本上的，也就是就算一个样本的误差，比如我们想要分类，就是预测的类别和实际类别的区别，是一个样本的，用L表示。

2.代价函数(Cost function)是定义在整个训练集上面的，也就是所有样本的误差的总和的平均，也就是损失函数的总和的平均，有没有这个平均其实不会影响最后的参数的求解结果。

3.总体损失函数(Total loss function)是定义在整个训练集上面的，也就是所有样本的误差的总和。也就是平时我们反向传播需要最小化的值。

通过本节的学习，我学会了：

1.深度学习的来由

2.深度学习的步骤

3.反向传播的基础知识