神经网络学习规则4| 学习笔记-阿里云开发者社区

神经网络学习规则4| 学习笔记

2022-11-12 276

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习神经网络学习规则4。

开发者学堂课程【机器学习算法：神经网络学习规则4】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/535/detail/7232

神经网络学习规则4

内容介绍

一、连续感知器学习规则：δ 规则

二、损失函数

三、梯度与梯度下降法

四、δ 规则

一、连续感知器学习规则：δ 规则

Delta学习规则( δ Learning Rule ) : 1986年,由认知心理学家 McCelland 和 Rumellhart 在神经网络训练中引入了学习规则。一种简单的有导师学习算法，该算法根据神经元的实际输出与期望输出差别来调整连接权。

Delta 学习规则的思路如下:系统首先用一个输入向量,输入网络结构,得到一个输出向量;每个输入向量都有一个对应的期望输出向量、或者称作是目标向量;比较实际输出向量与期望输出向量的差别，若没有差别,就不再继续学习:否则，连接的权重修改对应的差值( delta 差)。

二、损失函数

损失函数( Loss Function) :用于衡量最优的策略，通常是一个非负实值函数。机器学习试图通过不断的学习，建立一个可以很好预测现实结果的模型，损失函数则是用来衡量预测结果和真实结果之间的差距，其值越小,代表预测结果和真实结果越一致。损失函数越合适，通常模型的性能越好。通过各种方式缩小损失函数的过程被称作优化。损失函数记做 L(Y,f(x))。

1、0-1损失函数(0-1 LF) :预测值和实际值精确相等则“没有损失”为0,否则意味着“完全损失” ，为1预测值和实际值精确相等有些过于严格，可以采用两者的差小于某个阈值的方式。

Y 值是我的期望输出，f(x) 是我的实际输出，对L来讲就是精确匹配，严格要求的。对 L’来讲就是我的阈值是0.5，那就意味着说我的实际输出和我的预期输出的差的绝对值小于0.5的话就是没损失，大于0.5就是有损失。对L来讲，两个不完全相等就是有损失。比如说我的期望输出是0，实际输出是0.3的时候，实际上比较接近了，对严格的0-1损失函数来讲，它就是完全损失的，认为这个是错误的。对于我这个阈值为0.5的L来讲，因为预期输出和实际输出的差是小于0.5的，所以我认为这两个是一样的。可以看出严格损失的和设一个阈值是有区别的

2、绝对值损失函数( Absolute LF ) : 预测结果与真实结果差的绝对值。简单易懂,但是计算不方便。