支持向量机|机器学习推导系列(七)

简介: 支持向量机|机器学习推导系列(七)

一、硬间隔SVM


  1. 模型定义


假设有以下数据:


A[XM2RQ}LF{UZ0H0{~USF4P.png

VNM[VWZQ%OGU]8{PRTVWTKY.png


W6PY`~Y2$AXE`WJ2O[EOE`M.png

                                                  支持向量机


超平面实现将数据的正例和负例分隔开,因此有:


F6HS`6A0]S_39}(~F8`3M0O.png


另外最大间隔通过以下方式来表达:


[C2NB97TA(}WRFED544}@8N.png


然后求解支持向量机就可以转化为以下带约束的优化问题:


[X{TYZ~TUFS3ZI5{M~P$971.png


上述优化问题还可以进一步转化:


UKARS(`1F$ST7_KM0{W@[GM.png


由此上述优化问题转化为:


HPAYJA3[6M~N%~0D@EU9R}N.png


这是一个带N个约束的凸优化问题。


  1. 优化问题的转化


上述优化问题可以使用拉格朗日乘子法来求解,构建拉格朗日函数:


HPAYJA3[6M~N%~0D@EU9R}N.png


然后上述优化问题就可以转换为以下优化问题:


[YNQ{0PTTPGW{72`4Q$Z%9B.png


我们可以简单地看一下为什么可以这么转化:


$E0H_QZBPRZ2@PPJI$WI6X0.png


然后使用以下结论继续对该优化问题进行转化:


K{MC_Q@@QD5~N4H)(%1ZGMC.png


因此该优化问题可以继续转化:


M((X8YT(}ND4LIQLF1F@MTA.png


总结一下,该优化问题经历了以下转化过程:


88XSV(@BJOE~RG{SHJMO~EK.png


  1. 模型求解

`(L[~]O}8D@T7`Y(JA~CE(U.png

K(_58EJ5HODGIBYX4C9K461.png4M7OVO8$L6SH][2XFOPWM[N.png


  • KKT条件

首先定义该优化问题的KKT条件:


K6[HBW4``]%J75K}H0U(L5P.png


该优化问题满足上述KKT条件,这是由于以下定理:


Q{64AX7J8J2NUOZP@9YQ1@A.png


)~FJYE]5{@TH0CWKC`{UMEQ.png


S{(T`7PJ4VI%RJX1AHJZ]86.png

H%L8BSMQ}4)YUKJJNOO3T08.png


二、软间隔SVM


我们的训练数据通常不是理想的线性可分,有时甚至是线性不可分的数据。对于存在噪声的一些数据,我们应该允许一点分类错误,因此我们需要对目标函数进行一些调整:


@}GD71]VYB}Q(B5Y(~YQP_N.png


  1. 使用误分类点的个数作为loss

EMA3JUH]EV(0MJ$5@W$4DUJ.png


显然使用的指示函数是不连续的,不利于求解,所以不使用这种loss函数。


  1. 使用距离作为loss


4PURW_25QHK39)70S2[2RRE.png

FD{%WS9]PS8WHK~P[BXS%~B.png

                                                 合页损失函数


  1. 软间隔SVM的优化问题


SE[B8{1H7XL_UD5L`Z)2S3C.png


4AIYXU`W}[5%JU[FZ942M7O.png


软间隔SVM也是使用拉格朗日乘子法进行求解。


相关文章
|
9月前
|
机器学习/深度学习 算法 数据挖掘
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-2
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
|
9月前
|
机器学习/深度学习 Python
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-4
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
|
3月前
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
253 1
|
9月前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机(SVM)算法
【5月更文挑战第27天】在数据科学和人工智能的领域中,支持向量机(SVM)是一种强大的监督学习模型,它基于统计学习理论中的VC维理论和结构风险最小化原理。本文将详细介绍SVM的工作原理、核心概念以及如何在实际问题中应用该算法进行分类和回归分析。我们还将讨论SVM面临的挑战以及如何通过调整参数和核技巧来优化模型性能。
|
6月前
|
机器学习/深度学习 算法
【机器学习】SVM面试题:简单介绍一下SVM?支持向量机SVM、逻辑回归LR、决策树DT的直观对比和理论对比,该如何选择?SVM为什么采用间隔最大化?为什么要将求解SVM的原始问题转换为其对偶问题?
支持向量机(SVM)的介绍,包括其基本概念、与逻辑回归(LR)和决策树(DT)的直观和理论对比,如何选择这些算法,SVM为何采用间隔最大化,求解SVM时为何转换为对偶问题,核函数的引入原因,以及SVM对缺失数据的敏感性。
112 3
|
6月前
|
机器学习/深度学习 运维 算法
深入探索机器学习中的支持向量机(SVM)算法:原理、应用与Python代码示例全面解析
【8月更文挑战第6天】在机器学习领域,支持向量机(SVM)犹如璀璨明珠。它是一种强大的监督学习算法,在分类、回归及异常检测中表现出色。SVM通过在高维空间寻找最大间隔超平面来分隔不同类别的数据,提升模型泛化能力。为处理非线性问题,引入了核函数将数据映射到高维空间。SVM在文本分类、图像识别等多个领域有广泛应用,展现出高度灵活性和适应性。
268 2
|
6月前
|
机器学习/深度学习 算法
【机器学习】支持向量机SVM、逻辑回归LR、决策树DT的直观对比和理论对比,该如何选择(面试回答)?
文章对支持向量机(SVM)、逻辑回归(LR)和决策树(DT)进行了直观和理论上的对比,并提供了在选择这些算法时的考虑因素,包括模型复杂度、损失函数、数据量需求、对缺失值的敏感度等。
90 1
|
9月前
|
机器学习/深度学习 算法 Python
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-1
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享
PYTHON银行机器学习:回归、随机森林、KNN近邻、决策树、高斯朴素贝叶斯、支持向量机SVM分析营销活动数据|数据分享-1
|
9月前
|
机器学习/深度学习 数据采集 算法
深入理解并应用机器学习算法:支持向量机(SVM)
【5月更文挑战第13天】支持向量机(SVM)是监督学习中的强分类算法,用于文本分类、图像识别等领域。它寻找超平面最大化间隔,支持向量是离超平面最近的样本点。SVM通过核函数处理非线性数据,软间隔和正则化避免过拟合。应用步骤包括数据预处理、选择核函数、训练模型、评估性能及应用预测。优点是高效、鲁棒和泛化能力强,但对参数敏感、不适合大规模数据集且对缺失数据敏感。理解SVM原理有助于优化实际问题的解决方案。
|
9月前
|
机器学习/深度学习 人工智能 算法
探索机器学习中的支持向量机(SVM)算法
【5月更文挑战第6天】在数据科学和人工智能的广阔天地中,支持向量机(SVM)以其强大的分类能力与理论深度成为机器学习领域中的一个闪亮的星。本文将深入探讨SVM的核心原理、关键特性以及实际应用案例,为读者提供一个清晰的视角来理解这一高级算法,并展示如何利用SVM解决实际问题。
222 7