什么是感知机「Perceptron」
PLA全称是Perceptron Linear Algorithm,即线性感知机算法,属于一种最简单的感知机(Perceptron)模型。
感知机模型是机器学习二分类问题中的一个非常简单的模型。它的基本结构如下图所示:
PLA理论解释
对于二分类问题,可以使用感知机模型来解决。PLA的基本原理就是逐点修正,首先在超平面上随意取一条分类面,统计分类错误的点;然后随机对某个错误点就行修正,即变换直线的位置,使该错误点得以修正;接着再随机选择一个错误点进行纠正,分类面不断变化,直到所有的点都完全分类正确了,就得到了最佳的分类面。
利用二维平面例子来进行解释,第一种情况是错误地将正样本「y=+1」分类为负样本「y=-1」。此时,wx<0,即w与x的夹角大于90度,分类线 l 的两侧。修正的方法是让夹角变小,修正w值,使二者位于直线同侧:
修正过程示意图如下所示:
第二种情况是错误地将负样本「y=-1」分类为正样本「y=+1」。此时, wx>0 ,即 w 与 x 的夹角小于90度,分类线 l 的同一侧。修正的方法是让夹角变大,修正 w 值,使二者位于直线两侧:
修正过程示意图如下所示:
经过两种情况分析,我们发现PLA每次 w 的更新表达式都是一样的: w:=w+yx 。掌握了每次 w 的优化表达式,那么PLA就能不断地将所有错误的分类样本纠正并分类正确。
数据准备
该数据集包含了100个样本,正负样本各50,特征维度为2。
PLA算法
首先分别对两个特征进行归一化处理,即:
其中, μ 是特征均值, σ 是特征标准差。
其实,PLA算法的效率还算不错,只需要数次更新就能找到一条能将所有样本完全分类正确的分类线。所以得出结论,对于正负样本线性可分的情况,PLA能够在有限次迭代后得到正确的分类直线。
总结与疑问
本文导入的数据本身就是线性可分的,可以使用PLA来得到分类直线。但是,如果数据不是线性可分,即找不到一条直线能够将所有的正负样本完全分类正确,这种情况下,似乎PLA会永远更新迭代下去,却找不到正确的分类线。
对于线性不可分的情况,该如何使用PLA算法呢?我们下次将对PLA进行改进和优化。