周志华西瓜书-第六章学习总结

简介: 周志华西瓜书-第六章学习总结

分类学习:的思想就是在训练集的样本空间找到一个划分超平面,将不同类别的样本分开。但能将训练样本分开的划分超平面可能有很多,如何去寻找做合适的超平面成为我们需要研究的问题。        

image.png

直观上看,应该去找位于两类训练样本“正中间”的划分超平面,因为该划分超平面对训练样本局部扰动的“容忍”性最好。


支持向量和间隔:支持向量即距离超平面最近的这几个训练样本点使得下方等号成立,他们被称为“支持向量”。两个异类支持向量到超平面的距离之和成为“间隔”。

image.png

image.png

核函数:我们假设训练样本是线性可分的,即存在一个划分超平面能将训练样本正确分类,然而在显示任务中,原始样本空间内也许并不存在一个能正确划分两类样本的超平面。对于这样的问题,我们可将样本从原始空间映射到一个更高维的特征空间,使得样本在这个特征空间内线性可分。


若将原始的二维空间映射到一个合适的三维空间,就能找到一个合适的划分超平面。幸运的是,如果原始空间有限,即属性数有限,那么一定存在一个高维特征空间使样本可分。


软间隔和正则化:在前面的讨论中,我们一直假定训练样本在样本空间或特征空间中是线性可分的,即存在一个超平面能将不同类的样本完全划分开。然而,在现实任务 中往往很难确定合适的核函数使得训练样本在特征空间中线性可分;退一步说,即便恰好找到了某个核函数使训练集在特征空间中线性可分,也很难断定这个貌似线性可分的结果不是由于过拟合所造成的.,缓解该问题的一个办法是允许支持向量机在一些样本上出错。为此,要引入 “软间隔”(soft margin)的概念。


image.png


硬间隔:所有样本均满足约束,即所有样本必须划分正确,这成为硬间隔。软间隔则是允许某些样本不满足约束。


image.png


支持向量机回归:对于样本(x , y),传统回归模型通常直接基于模型输出f(x)与真实输出y之间的差别来计算损失,当且仅当f(x)与y完全相同时,损失才为零。与此不同,支持向量机回归(SVR)假设我们能容忍f(x)与y之间最多有e的偏差,即仅当f(x)与y之间的差别绝对值大于e时才计算损失。

image.png

核方法: 若不考虑“偏移项" 则无论 SVM还是SVR,学得的模型总能表示成核函数的线性组合。


通过“核化”(即引入核函数)来将线性学习器拓展为非线性学习器。从而达到解决非线性问题的目的。

相关文章
|
14天前
|
自动驾驶 开发者
从《为什么学生不喜欢上学》了解思考和学习
本书以“人类是如何思考和学习的”为线索,阐述了大脑关于学习的若干项基本运作原理,揭示了故事、情感、记忆、背景知识、练习在构建知识和创造持久学习经验中的重要性。
|
8月前
|
机器学习/深度学习 存储 算法
机器学习(西瓜书)简答题总结
机器学习(西瓜书)简答题总结
68 0
|
机器学习/深度学习 算法 数据挖掘
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
1958 0
周志华《机器学习》西瓜书精炼版笔记来了!16 章完整版
|
机器学习/深度学习 存储 人工智能
AcWing算法基础课笔记 第一章 基础算法
​编辑快速排序算法模板 —— 模板题 AcWing 785. 快速排序 归并排序算法模板 —— 模板题 AcWing 787. 归并排序 整数二分算法模板 —— 模板题 AcWing 789. 数的范围 浮点数二分算法模板 —— 模板题 AcWing 790. 数的三次方根 高精度加法 —— 模板题 AcWing 791. 高精度加法 高精度减法 —— 模板题 AcWing 792. 高精度减法 高精度乘低精度 —— 模板题 AcWing 793. 高精度乘法 高精度除以低精度 —— 模板题 AcWing 794. 高精度除法 一维前缀和 —— 模板题 AcWing 795.
328 0
|
机器学习/深度学习 前端开发 数据挖掘
西瓜书南瓜书都是好书【绪论】【模型评估与选择】读书笔记
西瓜书南瓜书都是好书【绪论】【模型评估与选择】读书笔记
111 0
西瓜书南瓜书都是好书【绪论】【模型评估与选择】读书笔记
|
机器学习/深度学习 算法
西瓜书南瓜书都是好书【线性模型】读书笔记
西瓜书南瓜书都是好书【线性模型】读书笔记
129 0
西瓜书南瓜书都是好书【线性模型】读书笔记
|
机器学习/深度学习 算法
周志华西瓜书-第四章学习总结
周志华西瓜书-第四章学习总结
周志华西瓜书-第四章学习总结
|
机器学习/深度学习 算法 知识图谱
周志华西瓜书-第五章学习总结
周志华西瓜书-第五章学习总结
周志华西瓜书-第五章学习总结
|
机器学习/深度学习 算法
机器学习-西瓜书、南瓜书第六章
支持向量机(Support Vector Machine),简称SVM,是一种经典的二分类模型,属于监督学习算法。
135 0
机器学习-西瓜书、南瓜书第六章
|
机器学习/深度学习 算法 数据挖掘
机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)
本博客为博主在学习 机器学习【西瓜书 / 南瓜书】过程中的学习笔记,每一章都是对《西瓜书》、《南瓜书》内容的总结和提炼笔记,博客可以作为各位读者的辅助思考,也可以做为读者快读书籍的博文,本博客对西瓜书所涉及公式进行详细的推理以及讲解,本人认为,不推导公式所学得的知识是没有深度的,是很容易忘记的,有些公式推导起来并不复杂,只是被看似复杂的数学表达式所“吓唬”,希望大家拿上纸笔,跟着博主一起学习,一起推导。
257 0
机器学习【西瓜书/南瓜书】--- 第1章绪论(学习笔记+公式推导)