Svm 介绍| 学习笔记

简介: 快速学习 Svm 介绍。

开发者学堂课程【机器学习算法 :Svm 介绍】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7263


Svm 介绍

 

内容介绍

一、约束

二、优化问题

三、优化问题整理

 

一、约束

image.png

间隔如果正类大于等于 d,相较于 d 而言0的范围相对宽松,因为虚线到分类超平面之间没有任何样本点,所以之间的距离就是 d,支持向量到分类超平面的距离也是 d,其他的点是大于 d 的,同样负类带到方程中是小于等于 d 的。

将左右两侧同时除以 d(因为距离肯定是非零正数)得到以下结果

image.png

再拆除,分母不变,分子进行分解得到以下结果

image.png

为了记起来方便,对上面表达式进行化简为:

image.png

上式表明,分类超平面由:

image.png

原因是做了简化后得到前面的式子,左右两边同除这个非零标量后得到结果,其实方程并没有发生改变:

image.png

例:y=2x 对应一条直线,2y=4x 也是对应一条直线,这两条直线是通过一条直线,和以上原理一致,都是同除一个非零标量后结果一致。看上去是两个超平面,其实是同一个。

最初分类结果有时候是1、-1或者0,因为整理公式后发现分类结果为1和-1,运算起来会更方便。

令 y=±1,就可以将不等式方程组统一为一个不等式方程:image.png

当 y=1 时,不等式方程左右两边不变,为正类;

当 y=-1 时,不等式方程右侧变为小于等于1,为负类。

 

二、优化问题

要找到支持向量机以及求出支持向量机的表达式,实际上就是要找到一组支持向量。要求支持向量到分类决策面的距离 d最大,既能满足最优分类器的要求(面向线性可分的记录)。

支持向量到分类超平面的距离是 d:

image.png

d 和约束都已得出公式。如果是正类则大于等于1,负类则小于等于-1。但什么时候等号成立呢?答案是:只有样本向量是支持向量时才能使等号成立。前面讲过分类超平面表达式大于等于 d,只有支持向量符合大于等于 d。所有样本点距离分类超平面最近的距离则为 d。

如果等于0,那么点会落在分类超平面上,如果为1的话,就落在距离分类超平面d距离的虚线上。

如果求支持向量,若想最大化间隔,只需将支持向量所对应的距离求出即可。

image.png

 

三、优化问题整理

优化问题经过转化后,有数学语言表达为:

image.png

其中image.png为向量各元素平方和的二分之一次方,为了方便计算,可以改成image.png的平方的最小值,实质没变,计算变得容易。

另外image.png变为image.png的平方后,计算时(经常会用到求导数,image.png的平方为二次方项,求导后会多出来一个2x)为了简便,image.png的平方改为image.png的平方,实质依然没变。

相关文章
|
前端开发 JavaScript Java
图解HTTP请求Tomcat服务器实现前后端交互-1
图解HTTP请求Tomcat服务器实现前后端交互
482 0
|
6月前
|
存储 弹性计算 缓存
阿里云服务器优选:经济型e与通用算力型u1的全方位对比与选择参考
在阿里云目前的活动中,经济型e实例与通用算力型u1实例凭借高性价比和价格实惠的特点,成为了众多用户优选选择的热门是实例规格。对于初次接触阿里云服务器的新手用户来说,如何在这两款实例中做出选择,可能是新手用户比较关心的问题。本文将为您详细解析经济型e与通用算力型u1实例的各项性能指标,以供您了解与选择参考。
|
12月前
|
运维 监控 数据可视化
Hyper-V的哪些性能?使其成为企业构建云平台和虚拟化环境的首选
Hyper-V凭借高效性、灵活性、高可用性及管理简便性等优势,成为企业构建云平台和虚拟化环境的首选。其微内核架构、硬件辅助虚拟化技术和动态内存管理提升了性能与资源利用率;支持多操作系统和硬件平台,具备故障转移、实时迁移功能,确保业务连续性;提供可视化管理工具和PowerShell脚本自动化,简化管理流程;与Windows Server及Azure无缝集成,降低硬件、运维和能源成本。
|
存储 运维 容灾
带你读《云上自动化运维宝典》——一文详解云上跨可用区容灾解决方案和异地多活能力建设最佳案例(3)
带你读《云上自动化运维宝典》——一文详解云上跨可用区容灾解决方案和异地多活能力建设最佳案例(3)
476 0
|
数据采集 机器学习/深度学习 算法
利用Python实现高效的数据清洗与预处理流程
在数据驱动的时代,数据清洗和预处理是数据分析与机器学习项目中至关重要的步骤。本文将介绍如何利用Python的pandas和numpy库,结合正则表达式、数据标准化和缺失值填充等技术,构建一个高效且灵活的数据清洗与预处理流程。文章不仅关注技术细节,还将探讨如何通过流程自动化和模块化来提升数据清洗的效率和准确性。
|
机器学习/深度学习 算法 数据挖掘
【机器学习】聚类算法中,如何判断数据是否被“充分”地聚类,以便算法产生有意义的结果?
【5月更文挑战第14天】【机器学习】聚类算法中,如何判断数据是否被“充分”地聚类,以便算法产生有意义的结果?
|
存储 缓存 Python
Python OrderedDict:有序字典的奥秘与实战应用
【4月更文挑战第1天】Python中的`collections`模块是一个包含特殊容器数据类型的库,这些数据类型提供了Python标准内建容器(如列表、字典、元组、集合和字符串)之外的其他功能。在这些特殊容器类型中,`OrderedDict`是一个非常有用且独特的存在,它提供了保持元素插入顺序的字典功能。
|
测试技术 Linux 开发工具
软件测试之【面试题综合训练题】
软件测试之【面试题综合训练题】
290 0
|
缓存 监控 测试技术
ERP系统对接方案与API接口封装系列(高并发)
企业资源规划(ERP)系统是现代企业管理的核心,它集成了企业内部的各个部门和业务流程。为了实现ERP系统与其他外部系统或应用程序之间的数据交换和协作,需要对接方案。API(应用程序编程接口)是实现系统对接的常用方法之一。
Kam
|
算法 Java Linux
使用SecureRandom生成验证码随机数,线程阻塞问题记录
使用SecureRandom生成验证码随机数,线程阻塞问题记录
Kam
1167 0

热门文章

最新文章