本项目基于卷积神经网络,通过Python的翻转功能沿垂直轴翻转每个图像,实现手势语言识别的功能。系统流程如图
本项目包括3个模块:设置直方图、载入手势图像、模型训练及保存。下面分别给出各模块的功能介绍及相关代码。
OpenCV-Python环境
安装OpenCV环境,输入命令:
pip install opencv_python-3.4.5-cp37-cp37m-win_amd64.whl
安装完毕。
使用训练集训练模型,使模型能够识别不同手势。
使用训练集训练模型,使模型能够识别不同手势。
系统测试
原VGG-16模型要求输入224×224×3的图片,限于GPU的计算能力,选择将28×28×1的数据集图片大小重置为56×56×1,由此计算出进入第一个全连接层的图像尺寸为7×7×256;最后一个全连接层输出值设为类别数量10。按设计好的参数定义模型结构,代码如下:
将数据代入模型进行测试,分类的标签与原始数据进行显示和对比,如图所示,可以得到验证:模型可以实现手势数字的识别。
测试准确率和召回率达到99%甚至更高,意味着这个预测模型训练比较成功,如图2
将数据代入模型进行测试,分类的标签与原始数据进行显示和对比,如图在这里插入图片描述