机器学习-西瓜书、南瓜书第六章

简介: 支持向量机(Support Vector Machine),简称SVM,是一种经典的二分类模型,属于监督学习算法。

支持向量机


支持向量机(Support Vector Machine),简称SVM,是一种经典的二分类模型,属于监督学习算法。


一、间隔与支持向量

支持向量机的目标是确定一个对样本的分类结果最鲁棒的线性分类器,即找到一个具有最大间隔的划分超平面。为此以间隔为优化目标,可将其转化为一个凸二次规划问题。


1、公式及推导过程:

image.png


2、什么是支持向量;

解:距离超平面最近的训练样本点使上式的等号成立,它们被称为“支持向量”


3、如何寻找最优的超平面;

解:首先量化最优指标(这里即为“间隔”);然后再求其最值(这里使最大化“间隔”),寻求约束条件;最后求解。


二、对偶问题

1、对一中第4小问公式如何求解;

解:利用拉格朗日乘子法得到其对偶问题,利用SMO算法求解对偶问题;


三、核函数

1、核函数产生的背景;

解:之前我们讨论的训练样本都是线性可分的,但在现实任务中,这样的情况出现的很少;对于这样的问题,解决办法就是将原始样本空间映射到一个更高维度的空间,使样本在这个空间线性可分(注:如果样本的原始空间是有限维度的,那么一定存在一个更高维的空间使其线性可分)


2、对原始空间线性不可分,但存在高维特征空间使其线性可分,试推导出其目标函数;(这个和前面的原始空间线性可分的模型类似,只是将原始空间映射到高位特征空间ф(x)而已,最后将ф(xi)的转置*ф(xj)定义为核函数而已)


四、软间隔与正则化

1、背景:


在前面的讨论中,我们一直假设训练样本在样本空间或特征空间中是线性可分的,即存在一个超平面能将不同类的样本完全划分。然而,在现实任务中往往很难确定合适的核函数使得训练样本在特征空间中线性可分,退一步说,即便恰好找到了某个核函数使训练集在特征空间中线性可分,也很难断定这个貌似线性可分的结果是不是由于过拟合造成的。>


2、什么是“软间隔”;

解:“软间隔就是允许支持向量在一些样本上出错”


3、 掌握“软间隔”的优化目标;知道常用的替代损失函数;理解如何求解目标函数最优解;

解:与前面方法类似,利用拉格朗日乘子法求解;


五、支持向量回归

1、 掌握整个支持向量回归的建模过程;


2、明白其中的公式推导;


六、核方法

1、知道”表示定理“;

2、以线性判别分析为例,演示如何通过核化来对其进行非线性拓展,从而得到核线性判别分析。

以下为参考链接导图西瓜书自学笔记分享第五章 - 知乎

5e420d3be56d751967b16baf9669ed28_1a3dbed8489bd48c11030c4a18a381ef.png

9e259a9dcd477d2a6f30a4cb66978ab2_6a9e9421548ee8db2d55ff59a979acdf.png

ab7c244d6a6e01b04901a3e07984fa9c_b42ddfd694fc496079c05fe893b23c2d.png

目录
相关文章
|
机器学习/深度学习 算法
经典机器学习系列(六)【集成学习】之周志华西瓜书-AdaBoost算法证明解析
经典机器学习系列(六)【集成学习】之周志华西瓜书-AdaBoost算法证明解析
173 0
|
8月前
|
机器学习/深度学习 存储 算法
机器学习(西瓜书)简答题总结
机器学习(西瓜书)简答题总结
68 0
|
机器学习/深度学习 算法 数据挖掘
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
1959 0
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
|
机器学习/深度学习
机器学习-西瓜书、南瓜书第五章
神经网络起源于生物神经元的生物原理,生物神经元通常包括细胞体、树突和轴突等部分。其中,树突适用于接受输入信息,突触对输入信息进行处理,达到一定条件后由轴突产生输出,此时神经元表现为激活兴奋的状态。
125 0
机器学习-西瓜书、南瓜书第五章
|
机器学习/深度学习 算法
机器学习-西瓜书、南瓜书第四章
基于树结构来进行决策,体现人类在面临决策问题时一种很自然的处理机制
88 0
机器学习-西瓜书、南瓜书第四章
|
机器学习/深度学习 数据采集 算法
机器学习-西瓜书、南瓜书第三章
回归任务最常用的性能度量是均方误差,因为均方误差有比较好的几何意义,对应了最常用的**“欧氏距离”,最小二乘法就是基于均方误差进行模型求解的。 求解均方误差最小化的过程称为参数估计
125 0
机器学习-西瓜书、南瓜书第三章
|
机器学习/深度学习 算法 数据挖掘
机器学习-西瓜书第一、二章
数据集:所有数据的集合 训练集:训练样本的集合 属性(特征):某事物或对象在某方面表现的性质 属性值:属性的取值 属性空间/样本空间/输入空间:属性张成的空间 泛化能力:学得模型适用于新样本的能力(泛化能力强更好地适用于样本空间)
182 0
机器学习-西瓜书第一、二章
|
机器学习/深度学习 算法
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(下)(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
240 0
机器学习【西瓜书/南瓜书】--- 第2章模型评估与选择(下)(学习笔记+公式推导)
|
机器学习/深度学习 算法 数据挖掘
机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
257 0
机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
|
8月前
|
机器学习/深度学习 存储 搜索推荐
利用机器学习算法改善电商推荐系统的效率
电商行业日益竞争激烈,提升用户体验成为关键。本文将探讨如何利用机器学习算法优化电商推荐系统,通过分析用户行为数据和商品信息,实现个性化推荐,从而提高推荐效率和准确性。
259 14