分别用线性SVM和高斯核SVM预测对数据进行分类-阿里云开发者社区

分别用线性SVM和高斯核SVM预测对数据进行分类

2023-02-22 106

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 分别用线性SVM和高斯核SVM预测对数据进行分类

分别用线性SVM和高斯核SVM预测对数据进行分类

（1）问题描述：

task1_linear.mat中有一批数据点，试用线性SVM对他们进行分类，并在图中画分出决策边界。task1_gaussian中也有一批数据点，试用高斯核SVM对他们进行分类，并在图中画出决策边界。

（2）训练过程：

使用线性核函数的svm算法

1.加载数据并可视化：

加载一个2维数据集：

X,y = svmF.loadData('task1_linear.mat')
svmF.plotData(X,y)

观察可知该数据集可以被线性边界分割为正样本和负样本。

2.训练模型与边界可视化：

model = svmF.svmTrain_SMO(X, y, C=1, max_iter=20)
svmF.visualizeBoundaryLinear(X, y, model)

变量 C所起的作用于逻辑回归中的正则化参数1 \λ

变量C 值对决策边界有不同的影响，下面我们尝试分几种情况验证：

C = 1 ：

C = 100 :

C = 1000 :

我们可以发现，C的大小影响着线性决策边界，其所起的作用于逻辑回归中正则化参数一样，C 太大，可能会导致过拟合问题。

使用高斯核函数的SVM算法

对于非线性的分类任务，常用带有高斯核函数的SVM算法来实现。

1.加载数据并可视化：

加载一个2维数据集：

X, y = svmF.loadData('task1_gaussian.mat')
svmF.plotData(X, y)

可以很明显地看出是非线性的数据。

2.训练模型与边界可视化：

model = svmF.svmTrain_SMO(X, y, C=1, kernelFunction='gaussian', K_matrix=svmF.gaussianKernel(X, sigma=0.1))
svmF.visualizeBoundaryGaussian(X, y, model,sigma=0.1)

实现效果如下所示：

（3）尝试调用sklearn：

调用sklearn svm，如下所示：

from sklearn import svm
c = 1
clf = svm.SVC(c, kernel='linear', tol=1e-3)
clf.fit(X, y)

结果：

高斯核：

c = 1
sigma = 0.1
clf = svm.SVC(c, kernel='rbf', gamma=np.power(sigma, -2))
clf.fit(X, y)

结果

实验报告地址：

点这里链接

分别用线性SVM和高斯核SVM预测对数据进行分类

分别用线性SVM和高斯核SVM预测对数据进行分类

（1）问题描述：

（2）训练过程：

（3）尝试调用sklearn：

实验报告地址：

热门文章

最新文章

相关课程

相关电子书

相关实验场景