深度学习相关概念:感知器

简介: 如今,Keras、TensorFlow 或 PyTorch 等框架提供了对大多数深度学习解决方案的交钥匙访问,而不必深入了解它们。但是,一旦您的模型没有按预期工作,这就会出现问题。您可能需要自己调整它。所以,如果你是来理解深度学习中感知器的概念,我认为你走在正确的轨道上,如果你想有一天能够以任何方式为这个生态系统做出贡献,那么了解这些的根源是必不可少的系统

a6a75db01d1e47f4829cca2776399690.png


摘要


 如今,Keras、TensorFlow 或 PyTorch 等框架提供了对大多数深度学习解决方案的交钥匙访问,而不必深入了解它们。但是,一旦您的模型没有按预期工作,这就会出现问题。您可能需要自己调整它。所以,如果你是来理解深度学习中感知器的概念,我认为你走在正确的轨道上,如果你想有一天能够以任何方式为这个生态系统做出贡献,那么了解这些的根源是必不可少的系统。否则,如果您已经熟悉感知器的概念,那也没什么大不了的。还是希望给你惊喜!在本文中,我将介绍Perceptron的概念。我们将看看它在 1950 年是如何被考虑的以及它是如何运作的。


背景


 早在 1943 年,McCulloch 和 Pitts 就发表了一篇题为神经活动内在思想的逻辑演算的论文—— 今天被称为神经网络的第一个数学模型这篇文章的想法是想要通过复制人脑的功能来创建智能机器的时代动力的一部分。我把它的摘要的开头作为证据。由于神经活动的“全有或全无”特性,神经事件及其之间的关系可以用命题逻辑来处理。当时,人脑的功能被普遍认为是相互连接的神经细胞像简单的逻辑门一样传输电信号和化学信号!


 现在让我们向前跳 14 年,到 1957 年,Rosenblatt 发表了一篇名为The Perceptron — A Perceiving and Recognizing Automaton 的文章。正是在这篇文章中,我们找到了今天所理解的感知器。一种学习最佳权重以与输入相乘以确定神经元是否激活的系统。下面你可以看到第一个被训练来识别物体或模式的感知器,在这种情况下,是字母表中的字母。


82f72796c621480399d901b1abb32787.png


应用于深度学习的感知器。


 基本感知器用于监督机器学习中的二元分类。提醒一下,例如,二元分类意味着只有两个类可以预测 1 和 -1。有监督的机器学习是指通过已经标记的数据(及其相关类)来训练模型。


数学定义


 我们按以下方式定义输入𝑥、输出y和权重𝑤。


f810bc18d4a14a4b86c458c4d7e2f97f.png


 其中 m 是向量 𝑤、𝑥 或y的大小。


 令 𝑧为由 𝑥 和 𝑤 的线性组合组成的净输入。


b6af850c3dc3431095dfe7db7301339b.png


 分类由激活函数phi : 𝜙 (𝑧) 定义,阈值theta : 𝜃 对应于所谓的偏差,我们稍后会看到。


19bb89bea0474e968029e85544012b30.png


 激活函数以某种方式定义了传入元素的分类方式。


 如果神经元激活,也就是说,如果z ≥ 𝜃,则当前输入将被分配为 1 类,否则为 -1。


 这种函数称为Heaviside 阶跃函数。


1baa4a840e0544f3be7f7e7ca2307293.png


 在上面,theta 等于 0。通过更改此值,我们将曲线向左或向右移动。


 回顾一下,既然我们已经添加了 theta,净输入 z 的方程式会发生一点变化。


 我们现在有:


51f354e1318a42a2a736f3025610a3b2.png

538cd07bc931432685c2127b63f4091e.png


 你现在知道感知器的数学定义了。


 这是等效的图形:


c028ecf8e912452f8ef2a6e2667bf3b1.png


训练感知器


 但是你如何训练一个感知器呢?

 以下是训练步骤:


1.将权重初始化为 0(或一个小的随机数)

2.对于每个训练样例x⁽ⁱ⁾:


  • 计算估计输出ŷ⁽ⁱ⁾
  • 更新权重


更新向量w的每个权重


7fc3e4d55f56454aaa1859237a802b19.png


完成如下:


6f77a1af1464497b9760091623d1d0d4.png


 我们引入eta的地方:𝜂, 学习率(在 0.0 和 1.0 之间)。


 根据您是否熟悉这些符号,您可能难以想象感知器是如何训练的。


例子

 

为了简单起见,让我们假设学习率等于 1 并且我们知道以下值。


643baf4fe41743bdba6de70ceb88dab4.png


 我们认为数据集中只有一个特征来简化计算。下面是一些在感知器中计算第一个权重的 delta 的例子。


94c52bfb8fcf470bb352deb4d9f09b38.png


 你可以看到激活函数给出的估计输出值被系统地从实际输出值中减去。


 当估计值与真实值相同时,它等于0,所以没有更新。


 否则,必须更新权重。


 最后两个例子就是这种情况。我们可以注意到输入 𝑥 的值尺度使权重更新或多或少变化。


 在示例 3 中,𝑥 = 3,因此权重差异为 6,而在示例 4 中,𝑥 = 0.5,因此权重差异仅为 1。


误差


 早些时候,我故意跳过了对误差的解释,以免给您带来过多的信息。如上所述,偏差是一个标量值,在通过激活函数之前添加到净输入 z 。它允许感知器的决策边界从原点移开,这在数据不可线性分离的情况下很有用。


d42f5162ac8140e2aad694fbbb4dcbb4.png


 偏差是感知器的附加值,它有自己的权重。这个权重也在学习阶段学习。


学习率


 学习率是一个标量值,它控制训练过程中权重更新的步长。根据其值,当存在预测错误时或多或少地修改权重。它的值是在训练过程之前定义的。所以,你必须小心,因为它的值在整个训练过程中保持不变。如果将其值设置得太高,感知器可能会超出最佳解决方案,并且可能无法收敛到一个好的解决方案。也就是说,它会在权重空间中采取较大的步长,这可能会导致越过最佳点并最终进入权重空间中比最优解更差的区域。


 此外,如果将其值设置得太低,感知器会收敛得太慢,并且可能需要很长时间来训练它。此外,它可能会陷入局部最小值而无法找到全局最小值。


821249775e3b4746a402cb00a4ffdfbb.png


 学习率的最佳值取决于许多因素。在训练期间尝试不同的值以找到提供最佳性能的值是很常见的。

目录
相关文章
|
8月前
|
机器学习/深度学习 自然语言处理 算法
深度学习算法概念介绍
深度学习算法概念介绍
|
26天前
|
机器学习/深度学习 算法 安全
从方向导数到梯度:深度学习中的关键数学概念详解
方向导数衡量函数在特定方向上的变化率,其值可通过梯度与方向向量的点积或构造辅助函数求得。梯度则是由偏导数组成的向量,指向函数值增长最快的方向,其模长等于最速上升方向上的方向导数。这两者的关系在多维函数分析中至关重要,广泛应用于优化算法等领域。
73 36
从方向导数到梯度:深度学习中的关键数学概念详解
|
2月前
|
机器学习/深度学习 自然语言处理 语音技术
Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧
本文介绍了Python在深度学习领域的应用,重点讲解了神经网络的基础概念、基本结构、训练过程及优化技巧,并通过TensorFlow和PyTorch等库展示了实现神经网络的具体示例,涵盖图像识别、语音识别等多个应用场景。
68 8
|
3月前
|
机器学习/深度学习 数据采集 自然语言处理
通过深度学习实践来理解深度学习的核心概念
通过实践,不仅可以加深对深度学习概念的理解,还能发现理论与实际之间的差距,进而对模型进行改进和优化。实践中遇到的问题(如梯度消失、过拟合、训练效率低等)能促使你深入思考,进而更加全面地掌握深度学习的核心概念。
58 4
|
7月前
|
机器学习/深度学习 算法 数据可视化
【从零开始学习深度学习】46. 目标检测中锚框的概念、计算方法、样本锚框标注方式及如何选取预测边界框
【从零开始学习深度学习】46. 目标检测中锚框的概念、计算方法、样本锚框标注方式及如何选取预测边界框
|
4月前
|
机器学习/深度学习 分布式计算 数据可视化
对深度学习概念的基础理解与认识
一、神经网络的组成 人工神经网络(Artificial Neural Networks,简写为ANNs)是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。 这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的,并具有自学习和自适应的能力。神经网络类型众多,其中最为重要的是多层感知机。为了详细地描述神经网络,我们先从最简单的神经网络说起。 感知机 感知机是1957年,由Rosenblatt提出会,是神经网络和支持向量机的基础。 感知机是有生物学上的一个启发,他的参照对象和理论依据可以参照下图:(我们的大脑可以认为是一个神经网络,
对深度学习概念的基础理解与认识
|
4月前
|
机器学习/深度学习 自动驾驶 搜索推荐
深度学习之探索神经网络、感知器与损失函数
在当今的数字化时代,深度学习作为一种强大的机器学习技术,正在迅速改变着我们的生活方式。无论是智能推荐系统、自动驾驶车辆还是语音识别应用,深度学习都在背后默默地发挥作用。
68 1
|
6月前
|
机器学习/深度学习 人工智能 并行计算
现代深度学习框架构建问题之线性代数的常见概念定义如何解决
现代深度学习框架构建问题之线性代数的常见概念定义如何解决
54 3
|
6月前
|
机器学习/深度学习 自然语言处理 算法
深度学习的关键概念和网络结构
度学习是人工智能和机器学习的一个重要分支,它通过模拟人脑神经元的工作方式来处理复杂的模式识别和数据分析任务。深度学习已经在许多领域取得了显著的成果,如图像识别、语音识别和自然语言处理。
80 1
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
机器学习之深度学习算法概念
深度学习算法是一类基于人工神经网络的机器学习方法,其核心思想是通过多层次的非线性变换,从数据中学习表示层次特征,从而实现对复杂模式的建模和学习。深度学习算法在图像识别、语音识别、自然语言处理等领域取得了巨大的成功,成为人工智能领域的重要技术之一。
98 3