基于opencv-python的身份证识别(KNN与OCR两种算法)

本文涉及的产品
票据凭证识别,票据凭证识别 200次/月
OCR统一识别,每月200次
通用文字识别,通用文字识别 200次/月
简介: 本文是学习opencv之初的一个阶段性小任务,主要做练习使用,并没有过多的追求准确率和高可用性,比如对输入身份证照片有要求,必须是完全的身份证照片,不能有背景,如需改进,可以通过增加轮廓检测和透视变换来裁剪出身份证照片;还有对身份证号区域的检测,采用的是先裁剪出一个固定大小的模板,进行模板匹配,当时学的比较浅,所以直接草率的这样做了,其实也可以通过轮廓检测排序,从而查找到身份证号区域。 另外,利用KNN算法做识别,也是我当时刚接触KNN算法,一时兴起做的,这算是我初次做算法模型训练,然后进行检测,也是为后来学习的各种深度学习算法打基础。效果并不是很好,因为我训练用到的数据集就是

本文是学习opencv之初的一个阶段性小任务,主要做练习使用,并没有过多的追求准确率和高可用性,比如对输入身份证照片有要求,必须是完全的身份证照片,不能有背景,如需改进,可以通过增加轮廓检测和透视变换来裁剪出身份证照片;还有对身份证号区域的检测,采用的是先裁剪出一个固定大小的模板,进行模板匹配,当时学的比较浅,所以直接草率的这样做了,其实也可以通过轮廓检测排序,从而查找到身份证号区域。

       另外,利用KNN算法做识别,也是我当时刚接触KNN算法,一时兴起做的,这算是我初次做算法模型训练,然后进行检测,也是为后来学习的各种深度学习算法打基础。效果并不是很好,因为我训练用到的数据集就是最后那一张图片(trainum.png),进行了少量的数据集增强。

KNN  train训练程序(train.py):

# -*-coding:utf-8-*-# @Author: Phantom# @编译环境:windows 10 + python3.8# @IDE:Pycharm2021.1.3importcv2.cv2ascvimportnumpyasnpdefKNN():
train=cv.imread("trainum.png", 0)
# 24*32trainimgs= [train]
# 腐蚀和膨胀,增强训练集foriinrange(1,3):
kernel=np.ones((i, i), np.uint8)
j=cv.erode(train, kernel)
trainimgs.append(j)
r=cv.dilate(train, kernel)
trainimgs.append(r)
# 生成knn对象knn=cv.ml.KNearest_create()
#训练knn模型fortrainimgintrainimgs:
cells= [np.hsplit(row, 30) forrowinnp.vsplit(trainimg, 11)]
x=np.array(cells)
# print(x[1][1])trn=x[:, :].reshape(-1,768).astype(np.float32)
k=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
train_label=np.repeat(k,30)
knn.train(trn,cv.ml.ROW_SAMPLE,train_label)
cell= [np.hsplit(row, 30) forrowinnp.vsplit(train, 11)]
x=np.array(cell)
# print(x[1][1])train=x[:, :].reshape(-1, 768).astype(np.float32)
t=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
train_label=np.repeat(t, 30)
returnknn,train,train_labeldefmain():
knn ,train,train_label=KNN()
test=train.copy()
test_label=train_label.copy()
ret, result, neighbours, dist=knn.findNearest(test, 3)
right=0foriinrange(330):
ifresult[i] ==test_label[i]:
right+=1# print(f'{len(test):}个测试数据识别正确{right:}个')#计算正确率ac=right/result.sizeprint(f'正确率{ac*100:.2f}%')
if__name__=='__main__':
main()
cv.waitKey(0)

KNN算法主程序:

# -*-coding:utf-8-*-# @Author: Phantom# @编译环境:windows 10 + python3.8# @IDE:Pycharm2021.1.3importcv2.cv2ascvimportnumpyasnpimporttrain# 读取图片和身份证号位置模板idimg=cv.imread("033.jpg")
idimg=cv.resize(idimg, (509, 321), interpolation=cv.INTER_CUBIC)
template=cv.imread("position1.jpg", 1)
cv.imshow("idimg", idimg)
# 转灰度图gray=cv.cvtColor(idimg, cv.COLOR_BGR2GRAY)
cv.imshow("gray", gray)
# 黑帽运算闭运算的卷积核kernel1=np.ones((15, 15), np.uint8)
# kernel2 = np.ones((1,1),np.uint8)# 黑帽运算cvblackhat=cv.morphologyEx(gray, cv.MORPH_BLACKHAT, kernel1)
cv.imshow("black", cvblackhat)
# 闭运算cvclose1=cv.morphologyEx(cvblackhat, cv.MORPH_CLOSE, kernel1)
cv.imshow("cvclose", cvclose1)
# 原图像二值化ref=cv.threshold(cvclose1, 0, 255, cv.THRESH_OTSU)[1]
# 身份证号码区域二值化twoimg=cv.threshold(cvblackhat, 0, 255, cv.THRESH_OTSU)[1]
cv.imshow("ref", ref)
# 为了模板匹配cv.imwrite("ref.jpg", ref)
ref=cv.imread("ref.jpg", 1)
# 获取模板高和宽h, w=template.shape[:2]
# 模板匹配(相关匹配)找身份证号码位置res=cv.matchTemplate(ref, template, cv.TM_CCORR)
# 获得最匹配地方的左上角坐标min_val, max_val, min_loc, max_loc=cv.minMaxLoc(res)
top_left=max_loc# 计算最匹配地方的右下角坐标bottom_right= (top_left[0] +w, top_left[1] +h)
# 框出身份证号区域并展示cv.rectangle(idimg, top_left, bottom_right, (0, 255, 0), 2)
cv.imshow("idimgOK", idimg)
# 展示身份证号码的二值图像rectangleid=cv.resize(twoimg[top_left[1]:bottom_right[1], top_left[0]:bottom_right[0]], (432, 32),
interpolation=cv.INTER_CUBIC)
# rectangleid = cv.erode(rectangleid,kernel2)cv.imshow("rectangleid", rectangleid)
# 划分获得每一个数字的图像cells= [np.hsplit(row, 18) forrowinnp.vsplit(rectangleid, 1)]
# 转换成np.array类型x=np.array(cells)
cv.imshow("cell9", x[0][9])
cv.imshow("cell10", x[0][10])
# 图像数据转换为特征矩阵test=x[:, :].reshape(-1, 768).astype(np.float32)
# 获得训练好的knn模型knn=train.KNN()
# 测试ret, result, neighbours, dist=knn.findNearest(test, 2)
# 输出预测结果result=np.uint8(result).reshape(-1, 18)[0]
id= ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "X"]
idstr=""foriinresult:
idstr+=id[i]
print(idstr)
cv.waitKey(0)

OCR算法主程序

# -*-coding:utf-8-*-# @Author: Phantom# @编译环境:windows 10 + python3.8# @IDE:Pycharm2021.1.3importcv2.cv2ascvimportnumpyasnpimportpytesseract# 读取图片和身份证号位置模板idimg=cv.imread("0033.jpg")
idimg=cv.resize(idimg, (509, 321), interpolation=cv.INTER_CUBIC)
idimgok=idimg.copy()
template=cv.imread("position1.jpg", 1)
cv.imshow("idimg", idimg)
# 转灰度图gray=cv.cvtColor(idimg, cv.COLOR_BGR2GRAY)
cv.imshow("gray", gray)
# 黑帽运算闭运算的卷积核kernel1=np.ones((15, 15), np.uint8)
# kernel2 = np.ones((1,1),np.uint8)# 黑帽运算cvblackhat=cv.morphologyEx(gray, cv.MORPH_BLACKHAT, kernel1)
cv.imshow("black", cvblackhat)
# 闭运算cvclose1=cv.morphologyEx(cvblackhat, cv.MORPH_CLOSE, kernel1)
cv.imshow("cvclose", cvclose1)
# 原图像二值化ref=cv.threshold(cvclose1, 0, 255, cv.THRESH_OTSU)[1]
# 身份证号码区域二值化twoimg=cv.threshold(cvblackhat, 0, 255, cv.THRESH_OTSU)[1]
cv.imshow("ref", ref)
# 为了模板匹配cv.imwrite("ref.jpg", ref)
ref=cv.imread("ref.jpg", 1)
# 获取模板高和宽h, w=template.shape[:2]
# 模板匹配(相关匹配)找身份证号码位置res=cv.matchTemplate(ref, template, cv.TM_CCORR)
# 获得最匹配地方的左上角坐标min_val, max_val, min_loc, max_loc=cv.minMaxLoc(res)
top_left=max_loc# 计算最匹配地方的右下角坐标bottom_right= (top_left[0] +w, top_left[1] +h)
# 框出身份证号区域并展示cv.rectangle(idimg, top_left, bottom_right, (0, 255, 0), 2)
cv.imshow("idimgOK", idimg)
# 展示身份证号码的二值图像rectangleid=cv.resize(idimgok[top_left[1] -2:bottom_right[1] +2, top_left[0] -2:bottom_right[0] +2], (436, 36),
interpolation=cv.INTER_CUBIC)
# rectangleid = cv.erode(rectangleid,kernel2)cv.imshow("rectangleid", rectangleid)
text=pytesseract.image_to_string(rectangleid)
print(text)
cv.waitKey(0)

程序中所用到的图片

0033.jpg为标准身份证照片

                                                                    position1.jpg

相关文章
|
8天前
|
监控 算法 安全
深度洞察内网监控电脑:基于Python的流量分析算法
在当今数字化环境中,内网监控电脑作为“守城卫士”,通过流量分析算法确保内网安全、稳定运行。基于Python的流量分析算法,利用`scapy`等工具捕获和解析数据包,提取关键信息,区分正常与异常流量。结合机器学习和可视化技术,进一步提升内网监控的精准性和效率,助力企业防范潜在威胁,保障业务顺畅。本文深入探讨了Python在内网监控中的应用,展示了其实战代码及未来发展方向。
|
25天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
87 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
1月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
310 55
|
1月前
|
存储 缓存 监控
局域网屏幕监控系统中的Python数据结构与算法实现
局域网屏幕监控系统用于实时捕获和监控局域网内多台设备的屏幕内容。本文介绍了一种基于Python双端队列(Deque)实现的滑动窗口数据缓存机制,以处理连续的屏幕帧数据流。通过固定长度的窗口,高效增删数据,确保低延迟显示和存储。该算法适用于数据压缩、异常检测等场景,保证系统在高负载下稳定运行。 本文转载自:https://www.vipshare.com
127 66
|
7天前
|
存储 算法 安全
控制局域网上网软件之 Python 字典树算法解析
控制局域网上网软件在现代网络管理中至关重要,用于控制设备的上网行为和访问权限。本文聚焦于字典树(Trie Tree)算法的应用,详细阐述其原理、优势及实现。通过字典树,软件能高效进行关键词匹配和过滤,提升系统性能。文中还提供了Python代码示例,展示了字典树在网址过滤和关键词屏蔽中的具体应用,为局域网的安全和管理提供有力支持。
34 17
|
16天前
|
存储 监控 算法
员工电脑监控屏幕场景下 Python 哈希表算法的探索
在数字化办公时代,员工电脑监控屏幕是保障信息安全和提升效率的重要手段。本文探讨哈希表算法在该场景中的应用,通过Python代码例程展示如何使用哈希表存储和查询员工操作记录,并结合数据库实现数据持久化,助力企业打造高效、安全的办公环境。哈希表在快速检索员工信息、优化系统性能方面发挥关键作用,为企业管理提供有力支持。
41 20
|
10天前
|
存储 人工智能 算法
深度解密:员工飞单需要什么证据之Python算法洞察
员工飞单是企业运营中的隐性风险,严重侵蚀公司利润。为应对这一问题,精准搜集证据至关重要。本文探讨如何利用Python编程语言及其数据结构和算法,高效取证。通过创建Transaction类存储交易数据,使用列表管理订单信息,结合排序算法和正则表达式分析交易时间和聊天记录,帮助企业识别潜在的飞单行为。Python的强大功能使得从交易流水和沟通记录中提取关键证据变得更加系统化和高效,为企业维权提供有力支持。
|
2月前
|
搜索推荐 Python
利用Python内置函数实现的冒泡排序算法
在上述代码中,`bubble_sort` 函数接受一个列表 `arr` 作为输入。通过两层循环,外层循环控制排序的轮数,内层循环用于比较相邻的元素并进行交换。如果前一个元素大于后一个元素,就将它们交换位置。
152 67
|
10天前
|
存储 算法 安全
U 盘管控情境下 Python 二叉搜索树算法的深度剖析与探究
在信息技术高度发达的今天,数据安全至关重要。U盘作为常用的数据存储与传输工具,其管控尤为关键。本文探讨Python中的二叉搜索树算法在U盘管控中的应用,通过高效管理授权U盘信息,防止数据泄露,保障信息安全。二叉搜索树具有快速插入和查找的优势,适用于大量授权U盘的管理。尽管存在一些局限性,如树结构退化问题,但通过优化和改进,如采用自平衡树,可以有效提升U盘管控系统的性能和安全性。
18 3
|
2月前
|
存储 搜索推荐 Python
用 Python 实现快速排序算法。
快速排序的平均时间复杂度为$O(nlogn)$,空间复杂度为$O(logn)$。它在大多数情况下表现良好,但在某些特殊情况下可能会退化为最坏情况,时间复杂度为$O(n^2)$。你可以根据实际需求对代码进行调整和修改,或者尝试使用其他优化策略来提高快速排序的性能
144 61

热门文章

最新文章