神经网络和反向传播算法——反向传播算法本质上是随机梯度下降,链式求导法则而来的

简介:

原文:https://www.zybuluo.com/hanbingtao/note/476663

写得非常好,适合入门!

神经元

神经元和感知器本质上是一样的,只不过我们说感知器的时候,它的激活函数是阶跃函数;而当我们说神经元时,激活函数往往选择为sigmoid函数或tanh函数。如下图所示:

计算一个神经元的输出的方法和计算一个感知器的输出是一样的。假设神经元的输入是向量激活函数是sigmoid函数。

神经网络是啥

神经网络其实就是按照一定规则连接起来的多个神经元。上图展示了一个全连接(full connected, FC)神经网络,通过观察上面的图,我们可以发现它的规则包括:

  • 神经元按照层来布局。最左边的层叫做输入层,负责接收输入数据;最右边的层叫输出层,我们可以从这层获取神经网络输出数据。输入层和输出层之间的层叫做隐藏层,因为它们对于外部来说是不可见的。
  • 同一层的神经元之间没有连接。
  • 第N层的每个神经元和第N-1层的所有神经元相连(这就是full connected的含义),第N-1层神经元的输出就是第N层神经元的输入。
  • 每个连接都有一个权值。

上面这些规则定义了全连接神经网络的结构。事实上还存在很多其它结构的神经网络,比如卷积神经网络(CNN)、循环神经网络(RNN),他们都具有不同的连接规则。

 

神经网络的训练

现在,我们需要知道一个神经网络的每个连接上的权值是如何得到的。我们可以说神经网络是一个模型,那么这些权值就是模型的参数,也就是模型要学习的东西。然而,一个神经网络的连接方式、网络的层数、每层的节点数这些参数,则不是学习出来的,而是人为事先设置的。对于这些人为设置的参数,我们称之为超参数(Hyper-Parameters)。

接下来,我们将要介绍神经网络的训练算法:反向传播算法。

。。。
















本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/bonelee/p/7716073.html,如需转载请自行联系原作者



相关文章
|
XML Java 数据格式
Java 实现汉字按照26个英文首字母分组排序(实际业务方法改造)
Java 实现汉字按照26个英文首字母分组排序(实际业务方法改造)
843 0
Java 实现汉字按照26个英文首字母分组排序(实际业务方法改造)
|
12月前
|
JavaScript API
Vue3实现面板分割
Vue3实现面板分割
290 1
|
10月前
|
自然语言处理 NoSQL API
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 基于指令的智能工具调用决策 智能体
基于百炼平台的 `qwen-max` API,设计了一套融合检索增强、图谱增强及指令驱动的智能工具调用决策系统。该系统通过解析用户指令,智能选择调用检索、图谱推理或模型生成等工具,以提高问题回答的准确性和丰富性。系统设计包括指令解析、工具调用决策、检索增强、图谱增强等模块,旨在通过多种技术手段综合提升智能体的能力。
668 5
|
12月前
|
数据采集 数据挖掘 大数据
【Python篇】详细学习 pandas 和 xlrd:从零开始
【Python篇】详细学习 pandas 和 xlrd:从零开始
141 2
|
前端开发 Java Maven
【异常解决】org.yaml.snakeyaml.scanner.ScannerException: while scanning for the next token found character
【异常解决】org.yaml.snakeyaml.scanner.ScannerException: while scanning for the next token found character
2031 0
|
分布式计算 Hadoop 网络安全
|
网络协议 安全 测试技术
localhost和127.0.0.1的区别是什么
与localhost不同的是,127.0.0.1是一个明确的IP地址,不受本地hosts文件或DNS设置的影响
573 2
|
关系型数据库 MySQL 数据库
bat批处理一键安装、卸载mysql数据库
bat批处理一键安装、卸载mysql数据库
271 0
|
SQL Java HIVE
hive 报system:java.io.tmpdir错误解决
Exception in thread "main" java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.
3179 0