核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？-阿里云开发者社区

核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？

2022-12-16 258

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 如果原始空间是有限维，即属性数有限，那么一定存在一个高维特征空间使得样本可分。

核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？

1. 线性支持向量机

支持向量机的思想就是给定训练样本集 $D$，在样本空间中找到一个划分的超平面，例如下图：
在这里插入图片描述

但如果遇到某一些数据，并没有这么容易可以用一个平面分隔开，像如下的环形数据：

alt

现实中非线性的数据还是很多数的，而解非线性问题要远比线性问题复杂得多，花费的资源也会成倍的增加，为此我们使用了核技巧（kernel trick）。

2. 核函数

如果原始空间是有限维，即属性数有限，那么一定存在一个高维特征空间使得样本可分。¹

简单地讲，就是把数据映射到一个更加高维的空间，让数据在此高维空间上的映射线性可分。文字可能不太容易懂，看图的话，我们会比较直观。

还是如上面的环形数据，利用了核函数映射后在三维空间上的分布，如下图所示：

在这里插入图片描述

利用 scikit-learn 计算的关于原点 (0, 0) 的 RBF（高斯）映射，结尾会附上代码。

不难看出，在这个三维空间上的点，能够简单的用一个平面就分隔开，这样就避免了解非线性问题。

2.1. 径向基函数（Radial Basis Function）

所谓径向基函数，就是某种沿径向对称的标量函数。通常定义为空间中任一点 $x$ 到某一中心 $x_c$ 之间欧氏距离的单调函数。$x$ 越远离中心，函数的取值就越小。²

一般 RBF 核又指高斯核，其形式为：

$$ \kappa(\boldsymbol{x}_i,\boldsymbol{x}_j)=\mathrm{exp}\left(- \frac{\left\|\boldsymbol{x}_i-\boldsymbol{x}_j\right\|^2}{2\sigma^2}\right ) $$

其中 $\sigma \gt 0$ 为高斯核的带宽（其实意义与高斯分布的差不多），$\boldsymbol{x}_i$ 就是第 $i$ 个数据。

2.2. 计算核函数

计算核函数可以使用 sklearn 的 sklearn.metrics.pairwise.rbf_kernel 来计算：（具体的代码，可以在我的 Github 上下载，如果对你有帮助，希望可以给我个 star。）

>>> from sklearn.metrics import pairwise

>>> # draw circles data
>>> X, y = make_circles(100, factor=.1, noise=.1)
>>> # calculate the rbf (gaussian) kernel between X and (0, 0)
>>> K = pairwise.rbf_kernel(X, np.array([[0, 0]]))
>>> print(K)
[[0.58581766]
 [0.74202632]
...
 [0.63660304]
 [0.98952965]]

利用这种变换，我们就可以用 SVM 在数据之间找到一个可以把两个类别区分开来的平面了：

在这里插入图片描述

《机器学习》周志华，第 6 章支持向量机，6.3 核函数 ↩
百度百科，高斯核函数 ↩

核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？

核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？

1. 线性支持向量机

2. 核函数

2.1. 径向基函数（Radial Basis Function）

2.2. 计算核函数

热门文章

最新文章

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？

核函数：RBF 是如何让线性 SVM 可以分类非线性数据的？

1. 线性支持向量机

2. 核函数

2.1. 径向基函数（Radial Basis Function）

2.2. 计算核函数

热门文章

最新文章

相关电子书

相关实验场景