开发者学堂课程【机器学习算法 :Svm 介绍】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/535/detail/7263
Svm 介绍
内容介绍
一、约束
二、优化问题
三、优化问题整理
一、约束
间隔如果正类大于等于 d,相较于 d 而言0的范围相对宽松,因为虚线到分类超平面之间没有任何样本点,所以之间的距离就是 d,支持向量到分类超平面的距离也是 d,其他的点是大于 d 的,同样负类带到方程中是小于等于 d 的。
将左右两侧同时除以 d(因为距离肯定是非零正数)得到以下结果
再拆除,分母不变,分子进行分解得到以下结果
为了记起来方便,对上面表达式进行化简为:
上式表明,分类超平面由:
原因是做了简化后得到前面的式子,左右两边同除这个非零标量后得到结果,其实方程并没有发生改变:
例:y=2x 对应一条直线,2y=4x 也是对应一条直线,这两条直线是通过一条直线,和以上原理一致,都是同除一个非零标量后结果一致。看上去是两个超平面,其实是同一个。
最初分类结果有时候是1、-1或者0,因为整理公式后发现分类结果为1和-1,运算起来会更方便。
令 y=±1,就可以将不等式方程组统一为一个不等式方程:
当 y=1 时,不等式方程左右两边不变,为正类;
当 y=-1 时,不等式方程右侧变为小于等于1,为负类。
二、优化问题
要找到支持向量机以及求出支持向量机的表达式,实际上就是要找到一组支持向量。要求支持向量到分类决策面的距离 d最大,既能满足最优分类器的要求(面向线性可分的记录)。
支持向量到分类超平面的距离是 d:
d 和约束都已得出公式。如果是正类则大于等于1,负类则小于等于-1。但什么时候等号成立呢?答案是:只有样本向量是支持向量时才能使等号成立。前面讲过分类超平面表达式大于等于 d,只有支持向量符合大于等于 d。所有样本点距离分类超平面最近的距离则为 d。
如果等于0,那么点会落在分类超平面上,如果为1的话,就落在距离分类超平面d距离的虚线上。
如果求支持向量,若想最大化间隔,只需将支持向量所对应的距离求出即可。
三、优化问题整理
优化问题经过转化后,有数学语言表达为:
其中为向量各元素平方和的二分之一次方,为了方便计算,可以改成的平方的最小值,实质没变,计算变得容易。
另外变为的平方后,计算时(经常会用到求导数,的平方为二次方项,求导后会多出来一个2x)为了简便,的平方改为的平方,实质依然没变。