学习笔记: 机器学习经典算法-核SVM(KernelSVM)

简介: 机器学习经典算法-个人笔记和学习心得分享

1、核函数的概念

处理非线性数据问题本质是依靠升维(按照某种规则扩充数据的特征)使得原本在低维空间内线性不可分的数据在升维后的空间内变得线性可分。SVM的核函数 主要是为解决数据线性不可分而提出一系列变换函数,不同的特征扩充规则对应了了不同的核函数。

在实际应用 核SVM 的时候,往往是通过变形 线性SVM的目标函数 为适用核函数的效率形式:如
适用多项式特征的SVM优化函数
这里适用多项式核的SVM优化目标 $\max \sum_{i=1}^{m}\alpha_i - \frac {1}{2} \sum_{i=1}^{m}\sum_{j=1}^{m}\alpha_i\alpha_jy_iy_j\cdot x_ix_j $ 函数内嵌套了$i,j$两层加法循环,每次循环都是对样本集内的任意两个样本 $ x^{(i)},x^{(j)} $做一次点乘。对于这样的点乘运算,核函数 的思想在于直接通过变换$K$处理使得原始特征的点积结果与对两样本添加构造特征后计算的点积结果相类似的效果。这样相比起先添加构造特征提升数据维度,再应用线性SVM 。在SVM原始优化目标里直接以函数变换 $K$ 来计算升维后两样本 $ x_i'x_j' $的内积结果,不但降低了添加构造特征带来的硬件资源消耗,还进一步提升了运算效率。所以 核函数 本质只是一个在算法里提升效率的运算技巧(Kernel Trick)。

核函数 技巧一般多应用在两向量的内积处理上。

2、多项式核函数

一般数学形式:$K(X,Y) = (X\cdot Y + C)^d$ ,
基本原理就是通过添加多项式特征来进行数据升维,用核函数重新定义了两向量的点乘结果。

推导如下:
对于核函数 $K(X,Y) = (X\cdot Y + 1)^2$
$\because X\cdot Y = (x_1,x_2,...,x_n)\cdot (y_1,y_2,...,y_n) = \sum^{n}_{i=1}{x_iy_i}$
$\therefore (X\cdot Y + 1)^2 = ( \sum^{n}_{i=1}{x_iy_i} + 1)^2 = \sum^{n}_{i=1}{(x_i^2)(y_i^2)} + \sum^{n}_{i=2} \sum^{i-1}_{j=1}{(\sqrt2 x_ix_j)(\sqrt2 y_iy_j)} + \sum^{n}_{i=1}{(\sqrt2 x_i)(\sqrt2 y_i)} + 1$

从而在$(X\cdot Y + 1)^2$的结果里可以看到基于$X,Y$的原始特征添加了最高2次项的构造特征 $ x_i^2, x_ix_j,x_i $,并对两向量对应位置的分类进行了乘法运算和求和,也就是相当于一步完成了对$X,Y$添加构造特征升维再算内积的运算。

当$d = 1$时就对应了不使用添加构造特征 线性核函数 $K(X,Y) = XY$。

2.2 在SVM中应用多项式核函数

### Polynomial Features
from sklearn.preprocessing import PolynomialFeatures,StandardScaler
from sklearn.svm import SVC
from sklearn.pipeline import Pipeline
def Polynomial_KernelSVC(degree,C = 1.0):
    return Pipeline([
        ("std_scaler",StandardScaler()),
        ("kernelSVC",SVC(kernel="poly",degree=degree,C = C))
    ])
poly_kernel_SVC = Polynomial_KernelSVC(degree = 1)
poly_kernel_SVC.fit(X,y)

3、高斯核函数(RBF)

一般数学形式:$K(x,y) = e^{-\gamma \|x -y\| ^2}$ ,又称为RBF核(Radial Basis Functiona Keral), 径向基函数

高斯核函数本身也是一个非常好的相似性度量函数

  • 当两样本非常 相距非常近 的时候就有$\|x - y\|^2 \to 0, e^{-\gamma \|x -y\| ^2} \to 1 $
  • 当两样本非常 相距非常远 的时候就有$\|x - y\|^2 \to +\infty, e^{-\gamma \|x -y\| ^2} \to 0 $

在SVM中引入的 高斯核函数 本质作用也是一种升维处理,不过规则上不是通过添加多项式的处理方式,高斯核函数所做的事情是将当前数据集内的每一个样本作为 地标(landmark) 参考生成新特征,这个新构造的特征实际上反映了两样本点的相似性程度,从而在新特征空间内使得样本变得可分。由于高斯核函数升为变换将一个 $m*n$的数据映射成$m*m$的数据,所以在实际应用的时候会面临很高的算力开销,它的主要应用场景是样本集内特征数量比样本数量要多的时候$(m

高斯核函数形式上类似于统计学上的高斯函数 $g(x) = \frac {1}{\sigma \sqrt {2\pi}} e^{-\frac {1}{2}(x - \mu)^2}$ 。
高斯 $\frac {1}{2\sigma^2}$ 在高斯核函数里被描述成 $\gamma$,反映在决策边界上$\gamma$越大,模型的泛化出现过拟合,$\gamma$越小,模型的出现欠拟合。所以$\gamma$实际控制了高斯核SVM模型的泛化能力。


应用高斯核可以获得更为多样化的决策边界形状,并且只有一个控制超参数(gamma),相比多项式核容易选择。但存在可解释性差,无法获取超平面方程 $w^Tx+b = 0$ 所需的参数$w,b$。

3.2 在SVM中应用高斯核函数

### Polynomial Features
from sklearn.preprocessing import PolynomialFeatures,StandardScaler
from sklearn.svm import SVC
from sklearn.pipeline import Pipeline
def RBF_KernelSVC(gamma = 1):
    return Pipeline([
        ("std_scaler",StandardScaler()),
        ("kernelSVC",SVC(kernel="rbf",gamma = gamma))
    ])
rbf_kernel_SVC = RBF_KernelSVC(gamma = 1)
rbf_kernel_SVC.fit(X,y)

更多SVM核函数的优缺点介绍

目录
相关文章
|
4月前
|
机器学习/深度学习 数据采集 人工智能
【机器学习算法篇】K-近邻算法
K近邻(KNN)是一种基于“物以类聚”思想的监督学习算法,通过计算样本间距离,选取最近K个邻居投票决定类别。支持多种距离度量,如欧式、曼哈顿、余弦相似度等,适用于分类与回归任务。结合Scikit-learn可高效实现,需合理选择K值并进行数据预处理,常用于鸢尾花分类等经典案例。(238字)
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
1427 6
|
9月前
|
机器学习/深度学习 数据采集 人工智能
20分钟掌握机器学习算法指南
在短短20分钟内,从零开始理解主流机器学习算法的工作原理,掌握算法选择策略,并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻,帮助你告别算法选择的困惑,轻松踏入AI的大门。
598 8
|
10月前
|
机器学习/深度学习 存储 Kubernetes
【重磅发布】AllData数据中台核心功能:机器学习算法平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
AI训练师入行指南(三):机器学习算法和模型架构选择
从淘金到雕琢,将原始数据炼成智能珠宝!本文带您走进数字珠宝工坊,用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型,结合电商、医疗、金融等场景实战,手把手教您选择合适工具,打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术,让复杂问题迎刃而解。握紧算法刻刀,为数字世界雕刻文明!
399 6
|
12月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络
本项目展示了人脸识别算法的运行效果(无水印),基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络(GRNN)、概率神经网络(PNN)、深度神经网络(DNN)和反向传播(BP)神经网络在人脸识别中的应用,涵盖各算法的结构特点与性能比较。
|
机器学习/深度学习 人工智能 算法
机器学习算法的优化与改进:提升模型性能的策略与方法
机器学习算法的优化与改进:提升模型性能的策略与方法
2309 13
机器学习算法的优化与改进:提升模型性能的策略与方法
|
机器学习/深度学习 算法 网络安全
CCS 2024:如何严格衡量机器学习算法的隐私泄露? ETH有了新发现
在2024年CCS会议上,苏黎世联邦理工学院的研究人员提出,当前对机器学习隐私保护措施的评估可能存在严重误导。研究通过LiRA攻击评估了五种经验性隐私保护措施(HAMP、RelaxLoss、SELENA、DFKD和SSL),发现现有方法忽视最脆弱数据点、使用较弱攻击且未与实际差分隐私基线比较。结果表明这些措施在更强攻击下表现不佳,而强大的差分隐私基线则提供了更好的隐私-效用权衡。
320 14
|
机器学习/深度学习 人工智能 自然语言处理
解锁机器学习的新维度:元学习的算法与应用探秘
元学习作为一个重要的研究领域,正逐渐在多个应用领域展现其潜力。通过理解和应用元学习的基本算法,研究者可以更好地解决在样本不足或任务快速变化的情况下的学习问题。随着研究的深入,元学习有望在人工智能的未来发展中发挥更大的作用。
|
机器学习/深度学习 算法 数据挖掘
C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出
本文探讨了C语言在机器学习中的应用及其重要性。C语言以其高效性、灵活性和可移植性,适合开发高性能的机器学习算法,尤其在底层算法实现、嵌入式系统和高性能计算中表现突出。文章还介绍了C语言在知名机器学习库中的作用,以及与Python等语言结合使用的案例,展望了其未来发展的挑战与机遇。
430 1