💥1 概述
随着我国现代技术的不断发展,手写数字识别技术中需要处理的数据样本量及特征指标大幅增加,也对处理数据模型和方法提出了更高的要求。支持向量机(SVM)、逻辑回归模型(LR)及决策树模型(DT)等新兴机器的学习方法虽然能够处理小样本等分类问题,但在处理多样本多特征数据时分类精度还有待改进。因此,本文以提升模型处理多样本和多特征指标数据集的分类预测性能为目标,对不同的基础模型进行集成应用分析。手写数字识别是计算机视觉的一项典型应用,其成果可广泛应用于邮政编码识别、统计报表识别、考试成绩判定等领域。针对单幅图像中多个手写数字的自动分割及识别问题,文中采用自适应二值化方法实现手写数字与背景的分割,利用基于方向投影的改进算法将各个数字依次进行分割提取,通过手写Minist训练数据集对卷积神经网络的LeNet-5模型进行训练,利用Tensorflow实现了单幅图像内多个手写数字的分割与识别。实验结果表明,文中方法具有较高的可靠性,训练后的模型对新的手写数字平均识别率在92%以上,达到了预期的效果。所以针对手写数字识别模型偏大、嵌入式系统芯片运算量有限等问题,开展基于机器视觉的手写数字识别系统设计研究。
📚2 运行结果
点击运行之后会自动进入放有手写数字的文件夹,然后选择你想要识别的数字确定即可自动识别。
识别成功!
这里再展示一个数字6吧!
识别成功!
其他的数字也是一样的操作。
部分代码:
clc; clear all; close all; load Data.mat; [FileName,PathName,FilterIndex] = uigetfile({'*.jpg;*.tif;*.png;*.gif', ... '所有图像文件';... '*.*','所有文件' },'载入数字图像',... '.\\images\\手写数字\\t0.jpg'); if isequal(FileName, 0) || isequal(PathName, 0) return; end fileName = fullfile(PathName, FileName); I = imread(fileName); flag = 1; I1 = Normalize_Img(I); bw1 = Bw_Img(I1); bw2 = Thin_Img(bw1); bw = bw2; sz = size(bw); [r, c] = find(bw==1); rect = [min(c) min(r) max(c)-min(c) max(r)-min(r)]; vs = rect(1)+rect(3)*[5/12 1/2 7/12]; hs = rect(2)+rect(4)*[1/3 1/2 2/3]; pt1 = [rect(1:2); rect(1:2)+rect(3:4)]; pt2 = [rect(1)+rect(3) rect(2); rect(1) rect(2)+rect(4)]; k1 = (pt1(1,2)-pt1(2,2)) / (pt1(1,1)-pt1(2,1)); x1 = 1:sz(2); y1 = k1*(x1-pt1(1,1)) + pt1(1,2); k2 = (pt2(1,2)-pt2(2,2)) / (pt2(1,1)-pt2(2,1)); x2 = 1:sz(2); y2 = k2*(x2-pt2(1,1)) + pt2(1,2); if flag figure('Name', '数字识别', 'NumberTitle', 'Off', 'Units', 'Normalized', 'Position', [0.2 0.45 0.5 0.3]); subplot(2, 2, 1); imshow(I, []); title('原图像', 'FontWeight', 'Bold'); subplot(2, 2, 2); imshow(I1, []); title('归一化图像', 'FontWeight', 'Bold'); hold on; h = rectangle('Position', [rect(1:2)-1 rect(3:4)+2], 'EdgeColor', 'r', 'LineWidth', 2); xlabel('数字区域标记'); subplot(2, 2, 3); imshow(bw1, []); title('二值化图像', 'FontWeight', 'Bold'); subplot(2, 2, 4); imshow(bw, [], 'Border', 'Loose'); title('细化图像', 'FontWeight', 'Bold'); hold on; h = []; for i = 1 : length(hs) h = [h plot([1 sz(2)], [hs(i) hs(i)], 'r-')]; end for i = 1 : length(vs) h = [h plot([vs(i) vs(i)], [1 sz(1)], 'g-')]; end h = [h plot(x1, y1, 'y-')]; h = [h plot(x2, y2, 'm-')]; legend([h(1) h(4) h(7) h(8)], {'水平线', '竖直线', '左对角线', '右对角线'}, 'Location', 'BestOutside'); hold off; end v{1} = [1:sz(2); repmat(hs(1), 1, sz(2))]'; v{2} = [1:sz(2); repmat(hs(2), 1, sz(2))]'; v{3} = [1:sz(2); repmat(hs(3), 1, sz(2))]'; v{4} = [repmat(vs(1), 1, sz(1)); 1:sz(1)]'; v{5} = [repmat(vs(2), 1, sz(1)); 1:sz(1)]'; v{6} = [repmat(vs(3), 1, sz(1)); 1:sz(1)]'; v{7} = [x1; y1]'; v{8} = [x2; y2]'; for i = 1 : 8 num(i) = GetImgLinePts(bw, round(v{i})-1); end num(9) = sum(sum(endpoints(bw))); result = MaskRecon(Datas, num); msgbox(sprintf('识别结果:%d', result), '提示信息', 'modal');
🎉3 参考文献
部分理论来源于网络,如有侵权请联系删除。
[1]徐云,杨承翰,高磊.利用机器视觉的手写数字识别系统设计研究[J].自动化仪表,2022,43(09):10-13.DOI:10.16086/j.cnki.issn1000-0380.2021100030.
[2]黄贻望,雷彪.基于SVM的数字识别系统设计[J].信息技术与信息化,2022(12):52-57.