深度学习笔记(一): 神经网络之感知机详解-阿里云开发者社区

深度学习笔记(一): 神经网络之感知机详解

2024-10-16 111

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 深度学习笔记（一）：探索感知机模型及其在神经网络中的应用。

在这篇文章我们主要了解感知机定义、功能、模型如何去获得损失函数、以及有哪些方法去将损失函数极小化，从而确定模型参数

感知机模型的定义：

输入空间由xi(xi(1),xi(2),xi(3)…xi(n))组成，输出空间为{-1, +1}，由输入空间到输出空间的映射函数为 f(x)=sign(w·x+b) 称为感知机。其中w是权重向量，b称为偏置，w·x为w和x的内积。sign(x)是符号函数，即：
0
在这里插入图片描述

感知机模型的功能

感知机相当于一种二分类模型，输入为样本的特征向量，输出为样本的类别，取+1和-1。所以我们要得到一个正确的模型，感知器往往会要求数据集本身是线性可分的。
在二维平面上，线性可分意味着能用一条直线将正、负样本分开；
在三维空间中，线性可分意味着能用一个平面将正、负样本分开；
在n维空间中，线性可分意味着能用n-1维超平面将正、负样本分开。在这里插入图片描述
为了便于计算，我们往往会把线性不可分的样本在某种变换下成为线性可分。如果我们找不到一条直线可以把正负样本划分开那么我们可以通过两条直线来划分它，两者满足我们就说它是正样本，其它的就为负样本。还有一种划分方式，在工业界，人们往往会找一条曲线将其分隔开，但是问题是这条曲线怎么做呢？这就是我们要思考的问题，其实道理也很简单，我们先做一些线性分类器，然后我们在做线性分类器的叠加，形成一个锯齿状的线，而不是一条圆滑的线。总的来说，也就是说通过多个线性的分类器，逐个做组合来完成非线性的分割。
在这里插入图片描述

感知机模型图如下

在这里插入图片描述
从模型可看出，很明显我们要求解w和b，也就是说只有这样我们才能正确的分离所有正负样本的超平面S，那么要如何确定w和b，这就需要一个损失函数，并将损失函数极小化。我们通常采用的方法是梯度下降法来找到最优值，当然后面还会介绍比梯度下降法更好的方法，比如说有Momentum、AdaGrad、Adam。下面是这些方法的介绍(说的挺言简意赅的)
https://blog.csdn.net/m0_51004308/article/details/112614340

损失函数

我觉得这篇博客写的挺好的，这里就借鉴一下这篇大佬写的，下面是他的链接。

选择误分类点到超平面 S 的总距离作为损失函数。
首先，找出一个误分类点到超平面的距离
因为输入空间xi(xi(1),xi(2),xi(3)…xi(n))中任一点 x0到超平面S的距离:
在这里插入图片描述

深度学习笔记(一): 神经网络之感知机详解

感知机模型的定义：

感知机模型的功能

感知机模型图如下

损失函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

深度学习笔记(一): 神经网络之感知机详解

感知机模型的定义：

感知机模型的功能

感知机模型图如下

损失函数

热门文章

最新文章

相关课程

相关电子书

相关实验场景