LabVIEW通过嘴唇图像识别为残疾人士开发文本输入系统

简介: LabVIEW通过嘴唇图像识别为残疾人士开发文本输入系统

LabVIEW通过嘴唇图像识别为残疾人士开发文本输入系统


近年来,计算机已经成为现代人日常生活中的一种信息器具。人们可以使用计算机来处理复杂的文件,获取新信息并在线购物等。但是,上面讲的使用电脑的所有好处对普通人来说都很方便,残疾人总是无法享受电脑的现代生活。


许多残疾人辅助设备都是逐案设计的,如眼控鼠标、头控鼠标、使用单按钮的摩尔斯电码文本输入系统等。虽然这些辅助设备可以为使用计算机提供禁用的通信接口,但有一个共同的缺陷,即用户必须佩戴某种辅助设备的附件。该缺陷可能会引起残疾人的不适,他们通常长期继续使用这些辅助设备。


17df5c803d508f9982d6b19ddd9dba58.png


为了解决上述问题,设计了一种利用数字图像处理技术开发的辅助器件系统。使用辅助设备系统时,无需佩戴任何类型的附件。实现一个面部跟踪系统,根据嘴唇在脸上的相对位置执行嘴唇图像提取。嘴张或闭嘴的状态可以通过图像上上唇和下唇之间的相应垂直距离来识别。一旦检测到口开或闭嘴的状态,分别表示逻辑“1”或“0”,数据将通过并行端口接口传输到摩尔斯电码文本输入系统。应用图像识别技术检测嘴巴张开或闭嘴的状态,以取代我们系统中的机械按钮。此外,文本输入系统包括PS2键盘接口和RS232鼠标接口来连接PC。因此,可以达到使用嘴唇图像识别来控制计算机的目的。对于残疾人来说,使用图像识别系统来控制计算机会更加方便和舒适。


0baecc8a6dc6dd11789600729a4f68c8.png


人脸跟踪是预处理捕获图像的一个非常重要的步骤。准确提取嘴唇图像对于进一步的嘴唇识别是必要的。必须找到一种实时面部跟踪算法,该算法始终可以在捕获的图像序列中定位面部。


5888a4ce07009e73e05dc334e9befb52.png



人脸跟踪算法包括两个步骤:人脸检测和人脸验证。前一个过程将 RGB 类型的图像传输到 HSL 类型的图像。 此过程还减少了光强度变化的影响。接下来,使用HSL型图像的色相和饱和度信息进行阈值运算,以获得图像序列中的肤色范围。最后,使用了一些形态学操作,即侵蚀、扩张和凸壳来获得最大的肤色范围。面部跟踪的后一个过程包括确定执行面部验证的最大肤色范围。在此阶段,在最大肤色范围内与预定义的嘴唇图像图案进行了模式匹配操作。如果嘴唇图像区域在最大肤色范围内找到,则意味着此最大肤色范围是面部。相反,则意味着范围不是人脸,并且将放弃面部跟踪。


根据嘴唇在一系列图像中的相对位置来执行嘴唇图像提取,必须提前确定面部区域。面部和CCD相机之间的距离是可变的,因此应更改图像中皮肤颜色的最大范围。为了克服这个问题,按比例定义嘴唇范围的相对位置,以肤色的最大面积的宽度来分配嘴唇面积。


在嘴唇范围的提取和分配过程后获得完整的嘴唇图像。定义并提取张开或闭上嘴时上唇和下唇之间区域的轮廓。通过测量上唇和下唇之间的深黑色范围的方法,以识别张嘴或闭嘴的状态。


首先,对嘴唇图像中的肤色范围和深黑色范围进行ROB多阈值运算,然后可以得到两个二进制图像,即二值化。接下来,对显示肤色区域的二进制图像执行反向操作。最后,对显示肤色区域的二值图像和显示深黑色区域的二值图像执行逻辑AND运算,然后可以明显地获得上唇和下唇之间的深黑色区域。


当获得上唇和下唇之间深黑色区域的轮廓时,可以识别嘴巴张开或闭嘴的状态。定义三条直线来观察灰度的变化。然后,记录两个端点之间的相对距离,代表与深黑色区域轮廓相交的每条直线的边缘点。接下来,设置三个距离阈值。当每条直线上两个端点之间的相对距离分别大于相应的预定义阈值时,嘴巴将被识别为嘴张开状态。另一方面,嘴巴将被承认为嘴闭的状态。


一旦获得了张嘴或闭嘴的信息,可以将这些信息传输到摩尔斯电码文本输入系统,以在PC上执行文本输入的功能。

相关文章
|
14天前
|
机器学习/深度学习 人工智能 算法
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow
海洋生物识别系统。以Python作为主要编程语言,通过TensorFlow搭建ResNet50卷积神经网络算法,通过对22种常见的海洋生物('蛤蜊', '珊瑚', '螃蟹', '海豚', '鳗鱼', '水母', '龙虾', '海蛞蝓', '章鱼', '水獭', '企鹅', '河豚', '魔鬼鱼', '海胆', '海马', '海豹', '鲨鱼', '虾', '鱿鱼', '海星', '海龟', '鲸鱼')数据集进行训练,得到一个识别精度较高的模型文件,然后使用Django开发一个Web网页平台操作界面,实现用户上传一张海洋生物图片识别其名称。
105 7
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow
|
7天前
|
机器学习/深度学习 人工智能 算法
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
乐器识别系统。使用Python为主要编程语言,基于人工智能框架库TensorFlow搭建ResNet50卷积神经网络算法,通过对30种乐器('迪吉里杜管', '铃鼓', '木琴', '手风琴', '阿尔卑斯号角', '风笛', '班卓琴', '邦戈鼓', '卡萨巴', '响板', '单簧管', '古钢琴', '手风琴(六角形)', '鼓', '扬琴', '长笛', '刮瓜', '吉他', '口琴', '竖琴', '沙槌', '陶笛', '钢琴', '萨克斯管', '锡塔尔琴', '钢鼓', '长号', '小号', '大号', '小提琴')的图像数据集进行训练,得到一个训练精度较高的模型,并将其
19 0
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
|
3天前
|
机器学习/深度学习 人工智能 算法
【服装识别系统】图像识别+Python+人工智能+深度学习+算法模型+TensorFlow
服装识别系统,本系统作为图像识别方面的一个典型应用,使用Python作为主要编程语言,并通过TensorFlow搭建ResNet50卷积神经算法网络模型,通过对18种不同的服装('黑色连衣裙', '黑色衬衫', '黑色鞋子', '黑色短裤', '蓝色连衣裙', '蓝色衬衫', '蓝色鞋子', '蓝色短裤', '棕色鞋子', '棕色短裤', '绿色衬衫', '绿色鞋子', '绿色短裤', '红色连衣裙', '红色鞋子', '白色连衣裙', '白色鞋子', '白色短裤')数据集进行训练,最后得到一个识别精度较高的H5格式模型文件,然后基于Django搭建Web网页端可视化操作界面,实现用户在界面中
20 1
【服装识别系统】图像识别+Python+人工智能+深度学习+算法模型+TensorFlow
|
14天前
|
机器学习/深度学习 人工智能 算法
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂', '甲虫', '蝴蝶', '蝉', '蜻蜓', '蚱蜢', '蛾', '蝎子', '蜗牛', '蜘蛛')进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一张昆虫图片识别其名称。
151 7
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
|
15天前
|
机器学习/深度学习 人工智能 算法
【球类识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+TensorFlow
球类识别系统,本系统使用Python作为主要编程语言,基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集 '美式足球', '棒球', '篮球', '台球', '保龄球', '板球', '足球', '高尔夫球', '曲棍球', '冰球', '橄榄球', '羽毛球', '乒乓球', '网球', '排球'等15种常见的球类图像作为数据集,然后进行训练,最终得到一个识别精度较高的模型文件。再使用Django开发Web网页端可视化界面平台,实现用户上传一张球类图片识别其名称。
111 7
【球类识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+TensorFlow
|
5天前
|
机器学习/深度学习 文字识别 算法
LabVIEW图像识别的技术手段有什么?
LabVIEW图像识别的技术手段有什么?
13 3
|
17天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【5月更文挑战第50天】 随着人工智能技术的迅猛发展,深度学习已成为推动多个领域进步的关键力量。特别是在图像识别领域,深度学习模型如卷积神经网络(CNN)已表现出超越传统算法的性能。本文将探讨深度学习技术在自动驾驶系统中图像识别的实际应用,分析其在提高道路安全性和车辆自主性方面的潜力,并讨论面临的主要挑战及未来的发展方向。
|
3天前
|
机器学习/深度学习 人工智能 算法
【坚果识别】果实识别+图像识别系统+Python+计算机课设+人工智能课设+卷积算法
坚果识别系统,使用Python语言进行开发,通过TensorFlow搭建卷积神经网络算法模型,对10种坚果果实('杏仁', '巴西坚果', '腰果', '椰子', '榛子', '夏威夷果', '山核桃', '松子', '开心果', '核桃')等图片数据集进行训练,得到一个识别精度较高的模型文件,让后使用Django搭建Web网页端界面操作平台,实现用户上传一张坚果图片 识别其名称。
9 0
|
4天前
|
数据采集 算法 计算机视觉
LabVIEW开发指针式压力仪表图像识别
LabVIEW开发指针式压力仪表图像识别
|
9天前
|
机器学习/深度学习 移动开发 文字识别
视觉智能开放平台产品使用合集之h5页面使用人脸活体检测,是否需要自己开发UI
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。