从零使用SVM（支持向量积）进行模糊数字分类

2022-11-26 99

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 代码如下

数据集

这里下载这俩即可

分别读入训练数据和测试数据

 # 加载训练集数据以及测试集数据
    print('Load Training File Start...')
    # data = pd.read_csv('optdigits.tra', header=None)
    # x, y = data[list(range(64))], data[64]
    # x, y = x.values, y.values
    data = np.loadtxt('optdigits.tra', dtype=np.float, delimiter=',')
    x, y = np.split(data, (-1,), axis=1)
    images = x.reshape(-1, 8, 8)
    print('images.shape = ', images.shape)
    y = y.ravel().astype(np.int)
    print('Load Test Data Start...')
    data = np.loadtxt('optdigits.tes', dtype=np.float, delimiter=',')
    x_test, y_test = np.split(data, (-1,), axis=1)
    print(y_test.shape)
    images_test = x_test.reshape(-1, 8, 8)
    y_test = y_test.ravel().astype(np.int)
    print('Load Data OK...')

绘制部分训练集图像

 # 画出部分训练集图像
    matplotlib.rcParams['font.sans-serif'] = ['SimHei']
    matplotlib.rcParams['axes.unicode_minus'] = False
    plt.figure(figsize=(15, 9), facecolor='w')
    for index, image in enumerate(images[:16]):
        plt.subplot(4, 8, index + 1)
        plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
        plt.title('训练图片: %i' % y[index])
    for index, image in enumerate(images_test[:16]):
        plt.subplot(4, 8, index + 17)
        plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
        # save_image(image.copy(), index)
        plt.title('测试图片: %i' % y_test[index])
    plt.tight_layout()
    plt.show()

如下图

建模训练并预测

 #  建模训练并做预测
    model = svm.SVC(C=1, kernel='rbf', gamma=0.001)
    print('Start Learning...')
    t0 = time()
    model.fit(x, y)
    t1 = time()
    t = t1 - t0
    print('训练+CV耗时：%d分钟%.3f秒' % (int(t / 60), t - 60 * int(t / 60)))
    # print '最优参数：\t', model.best_params_
    # clf.fit(x, y)
    print('Learning is OK...')
    print('训练集准确率：', accuracy_score(y, model.predict(x)))
    y_hat = model.predict(x_test)
    print('测试集准确率：', accuracy_score(y_test, model.predict(x_test)))
    print(y_hat)
    print(y_test)

输出

寻找预测错误的数据

# 寻找预测错误数据
    err_images = images_test[y_test != y_hat]
    err_y_hat = y_hat[y_test != y_hat]
    err_y = y_test[y_test != y_hat]
    print(err_y_hat)
    print(err_y)

绘制部分预测错误的数据与预测值

# 画出部分预测错误数据
    plt.figure(figsize=(10, 8), facecolor='w')
    for index, image in enumerate(err_images):
        if index >= 12:
            break
        plt.subplot(3, 4, index + 1)
        plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
        plt.title('错分为：%i，真实值：%i' % (err_y_hat[index], err_y[index]))
    plt.tight_layout()
    plt.show()

如下图

全部代码

if __name__ == "__main__":
    # 加载训练集数据以及测试集数据
    print('Load Training File Start...')
    # data = pd.read_csv('optdigits.tra', header=None)
    # x, y = data[list(range(64))], data[64]
    # x, y = x.values, y.values
    data = np.loadtxt('optdigits.tra', dtype=np.float, delimiter=',')
    x, y = np.split(data, (-1,), axis=1)
    images = x.reshape(-1, 8, 8)
    print('images.shape = ', images.shape)
    y = y.ravel().astype(np.int)
    print('Load Test Data Start...')
    data = np.loadtxt('optdigits.tes', dtype=np.float, delimiter=',')
    x_test, y_test = np.split(data, (-1,), axis=1)
    print(y_test.shape)
    images_test = x_test.reshape(-1, 8, 8)
    y_test = y_test.ravel().astype(np.int)
    print('Load Data OK...')
    # x, x_test, y, y_test = train_test_split(x, y, test_size=0.4, random_state=1)
    # images = x.reshape(-1, 8, 8)
    # images_test = x_test.reshape(-1, 8, 8)
    # 画出部分训练集图像
    matplotlib.rcParams['font.sans-serif'] = ['SimHei']
    matplotlib.rcParams['axes.unicode_minus'] = False
    plt.figure(figsize=(15, 9), facecolor='w')
    for index, image in enumerate(images[:16]):
        plt.subplot(4, 8, index + 1)
        plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
        plt.title('训练图片: %i' % y[index])
    for index, image in enumerate(images_test[:16]):
        plt.subplot(4, 8, index + 17)
        plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
        # save_image(image.copy(), index)
        plt.title('测试图片: %i' % y_test[index])
    plt.tight_layout()
    plt.show()
    # params = {'C':np.logspace(0, 3, 7), 'gamma':np.logspace(-5, 0, 11)}
    # model = GridSearchCV(svm.SVC(kernel='rbf'), param_grid=params, cv=3)
    #  建模训练并做预测
    model = svm.SVC(C=1, kernel='rbf', gamma=0.001)
    print('Start Learning...')
    t0 = time()
    model.fit(x, y)
    t1 = time()
    t = t1 - t0
    print('训练+CV耗时：%d分钟%.3f秒' % (int(t / 60), t - 60 * int(t / 60)))
    # print '最优参数：\t', model.best_params_
    # clf.fit(x, y)
    print('Learning is OK...')
    print('训练集准确率：', accuracy_score(y, model.predict(x)))
    y_hat = model.predict(x_test)
    print('测试集准确率：', accuracy_score(y_test, model.predict(x_test)))
    print(y_hat)
    print(y_test)
    # 寻找预测错误数据
    err_images = images_test[y_test != y_hat]
    err_y_hat = y_hat[y_test != y_hat]
    err_y = y_test[y_test != y_hat]
    print(err_y_hat)
    print(err_y)
    # 画出部分预测错误数据
    plt.figure(figsize=(10, 8), facecolor='w')
    for index, image in enumerate(err_images):
        if index >= 12:
            break
        plt.subplot(3, 4, index + 1)
        plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
        plt.title('错分为：%i，真实值：%i' % (err_y_hat[index], err_y[index]))
    plt.tight_layout()
    plt.show()

从零使用SVM（支持向量积）进行模糊数字分类

数据集

分别读入训练数据和测试数据

绘制部分训练集图像

建模训练并预测

寻找预测错误的数据

绘制部分预测错误的数据与预测值

全部代码

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

从零使用SVM（支持向量积）进行模糊数字分类

数据集

分别读入训练数据和测试数据

绘制部分训练集图像

建模训练并预测

寻找预测错误的数据

绘制部分预测错误的数据与预测值

全部代码

热门文章

最新文章

相关课程

相关电子书