SVM (Support Vector Machine) 是一种常用的机器学习算法,特别是用于二分类问题。它的主要思想是在样本空间内寻找最优的超平面,以最大化两类样本的间隔,并保证其对边界点的分类准确。
SVM的优点在于它可以对高维数据进行非常好的分类,并且当数据量较大时具有很好的扩展性。
下面是SVM算法用Python实现:
import numpy as np
import matplotlib.pyplot as plt
from sklearn import svm
# 生成数据
np.random.seed(0)
X = np.r_[np.random.randn(20, 2) - [2, 2], np.random.randn(20, 2) + [2, 2]]
Y = [0] * 20 + [1] * 20
# 训练SVM分类器
clf = svm.SVC(kernel='linear')
clf.fit(X, Y)
# 绘制分类结果
w = clf.coef_[0]
a = -w[0] / w[1]
xx = np.linspace(-5, 5)
yy = a * xx - (clf.intercept_[0]) / w[1]
b = clf.support_vectors_[0]
yy_down = a * xx + (b[1] - a * b[0])
b = clf.support_vectors_[-1]
yy_up = a * xx + (b[1] - a * b[0])
plt.plot(xx, yy, 'k-')
plt.plot(xx, yy_down, 'k--')
plt.plot(xx, yy_up, 'k--')
plt.scatter(clf.support_vectors_[:, 0], clf.support_vectors_[:, 1],
s=80, facecolors='none')
plt.scatter(X[:, 0], X[:, 1], c=Y, cmap=plt.cm.Paired)
plt.axis('tight')
plt.show()
运行结果: