基于opencv-python的身份证识别(KNN与OCR两种算法)

本文涉及的产品
自定义KV模板,自定义KV模板 500次/账号
个人证照识别,个人证照识别 200次/月
通用文字识别,通用文字识别 200次/月
简介: 本文是学习opencv之初的一个阶段性小任务,主要做练习使用,并没有过多的追求准确率和高可用性,比如对输入身份证照片有要求,必须是完全的身份证照片,不能有背景,如需改进,可以通过增加轮廓检测和透视变换来裁剪出身份证照片;还有对身份证号区域的检测,采用的是先裁剪出一个固定大小的模板,进行模板匹配,当时学的比较浅,所以直接草率的这样做了,其实也可以通过轮廓检测排序,从而查找到身份证号区域。 另外,利用KNN算法做识别,也是我当时刚接触KNN算法,一时兴起做的,这算是我初次做算法模型训练,然后进行检测,也是为后来学习的各种深度学习算法打基础。效果并不是很好,因为我训练用到的数据集就是

本文是学习opencv之初的一个阶段性小任务,主要做练习使用,并没有过多的追求准确率和高可用性,比如对输入身份证照片有要求,必须是完全的身份证照片,不能有背景,如需改进,可以通过增加轮廓检测和透视变换来裁剪出身份证照片;还有对身份证号区域的检测,采用的是先裁剪出一个固定大小的模板,进行模板匹配,当时学的比较浅,所以直接草率的这样做了,其实也可以通过轮廓检测排序,从而查找到身份证号区域。

       另外,利用KNN算法做识别,也是我当时刚接触KNN算法,一时兴起做的,这算是我初次做算法模型训练,然后进行检测,也是为后来学习的各种深度学习算法打基础。效果并不是很好,因为我训练用到的数据集就是最后那一张图片(trainum.png),进行了少量的数据集增强。

KNN  train训练程序(train.py):

# -*-coding:utf-8-*-# @Author: Phantom# @编译环境:windows 10 + python3.8# @IDE:Pycharm2021.1.3importcv2.cv2ascvimportnumpyasnpdefKNN():
train=cv.imread("trainum.png", 0)
# 24*32trainimgs= [train]
# 腐蚀和膨胀,增强训练集foriinrange(1,3):
kernel=np.ones((i, i), np.uint8)
j=cv.erode(train, kernel)
trainimgs.append(j)
r=cv.dilate(train, kernel)
trainimgs.append(r)
# 生成knn对象knn=cv.ml.KNearest_create()
#训练knn模型fortrainimgintrainimgs:
cells= [np.hsplit(row, 30) forrowinnp.vsplit(trainimg, 11)]
x=np.array(cells)
# print(x[1][1])trn=x[:, :].reshape(-1,768).astype(np.float32)
k=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
train_label=np.repeat(k,30)
knn.train(trn,cv.ml.ROW_SAMPLE,train_label)
cell= [np.hsplit(row, 30) forrowinnp.vsplit(train, 11)]
x=np.array(cell)
# print(x[1][1])train=x[:, :].reshape(-1, 768).astype(np.float32)
t=np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
train_label=np.repeat(t, 30)
returnknn,train,train_labeldefmain():
knn ,train,train_label=KNN()
test=train.copy()
test_label=train_label.copy()
ret, result, neighbours, dist=knn.findNearest(test, 3)
right=0foriinrange(330):
ifresult[i] ==test_label[i]:
right+=1# print(f'{len(test):}个测试数据识别正确{right:}个')#计算正确率ac=right/result.sizeprint(f'正确率{ac*100:.2f}%')
if__name__=='__main__':
main()
cv.waitKey(0)

KNN算法主程序:

# -*-coding:utf-8-*-# @Author: Phantom# @编译环境:windows 10 + python3.8# @IDE:Pycharm2021.1.3importcv2.cv2ascvimportnumpyasnpimporttrain# 读取图片和身份证号位置模板idimg=cv.imread("033.jpg")
idimg=cv.resize(idimg, (509, 321), interpolation=cv.INTER_CUBIC)
template=cv.imread("position1.jpg", 1)
cv.imshow("idimg", idimg)
# 转灰度图gray=cv.cvtColor(idimg, cv.COLOR_BGR2GRAY)
cv.imshow("gray", gray)
# 黑帽运算闭运算的卷积核kernel1=np.ones((15, 15), np.uint8)
# kernel2 = np.ones((1,1),np.uint8)# 黑帽运算cvblackhat=cv.morphologyEx(gray, cv.MORPH_BLACKHAT, kernel1)
cv.imshow("black", cvblackhat)
# 闭运算cvclose1=cv.morphologyEx(cvblackhat, cv.MORPH_CLOSE, kernel1)
cv.imshow("cvclose", cvclose1)
# 原图像二值化ref=cv.threshold(cvclose1, 0, 255, cv.THRESH_OTSU)[1]
# 身份证号码区域二值化twoimg=cv.threshold(cvblackhat, 0, 255, cv.THRESH_OTSU)[1]
cv.imshow("ref", ref)
# 为了模板匹配cv.imwrite("ref.jpg", ref)
ref=cv.imread("ref.jpg", 1)
# 获取模板高和宽h, w=template.shape[:2]
# 模板匹配(相关匹配)找身份证号码位置res=cv.matchTemplate(ref, template, cv.TM_CCORR)
# 获得最匹配地方的左上角坐标min_val, max_val, min_loc, max_loc=cv.minMaxLoc(res)
top_left=max_loc# 计算最匹配地方的右下角坐标bottom_right= (top_left[0] +w, top_left[1] +h)
# 框出身份证号区域并展示cv.rectangle(idimg, top_left, bottom_right, (0, 255, 0), 2)
cv.imshow("idimgOK", idimg)
# 展示身份证号码的二值图像rectangleid=cv.resize(twoimg[top_left[1]:bottom_right[1], top_left[0]:bottom_right[0]], (432, 32),
interpolation=cv.INTER_CUBIC)
# rectangleid = cv.erode(rectangleid,kernel2)cv.imshow("rectangleid", rectangleid)
# 划分获得每一个数字的图像cells= [np.hsplit(row, 18) forrowinnp.vsplit(rectangleid, 1)]
# 转换成np.array类型x=np.array(cells)
cv.imshow("cell9", x[0][9])
cv.imshow("cell10", x[0][10])
# 图像数据转换为特征矩阵test=x[:, :].reshape(-1, 768).astype(np.float32)
# 获得训练好的knn模型knn=train.KNN()
# 测试ret, result, neighbours, dist=knn.findNearest(test, 2)
# 输出预测结果result=np.uint8(result).reshape(-1, 18)[0]
id= ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "X"]
idstr=""foriinresult:
idstr+=id[i]
print(idstr)
cv.waitKey(0)

OCR算法主程序

# -*-coding:utf-8-*-# @Author: Phantom# @编译环境:windows 10 + python3.8# @IDE:Pycharm2021.1.3importcv2.cv2ascvimportnumpyasnpimportpytesseract# 读取图片和身份证号位置模板idimg=cv.imread("0033.jpg")
idimg=cv.resize(idimg, (509, 321), interpolation=cv.INTER_CUBIC)
idimgok=idimg.copy()
template=cv.imread("position1.jpg", 1)
cv.imshow("idimg", idimg)
# 转灰度图gray=cv.cvtColor(idimg, cv.COLOR_BGR2GRAY)
cv.imshow("gray", gray)
# 黑帽运算闭运算的卷积核kernel1=np.ones((15, 15), np.uint8)
# kernel2 = np.ones((1,1),np.uint8)# 黑帽运算cvblackhat=cv.morphologyEx(gray, cv.MORPH_BLACKHAT, kernel1)
cv.imshow("black", cvblackhat)
# 闭运算cvclose1=cv.morphologyEx(cvblackhat, cv.MORPH_CLOSE, kernel1)
cv.imshow("cvclose", cvclose1)
# 原图像二值化ref=cv.threshold(cvclose1, 0, 255, cv.THRESH_OTSU)[1]
# 身份证号码区域二值化twoimg=cv.threshold(cvblackhat, 0, 255, cv.THRESH_OTSU)[1]
cv.imshow("ref", ref)
# 为了模板匹配cv.imwrite("ref.jpg", ref)
ref=cv.imread("ref.jpg", 1)
# 获取模板高和宽h, w=template.shape[:2]
# 模板匹配(相关匹配)找身份证号码位置res=cv.matchTemplate(ref, template, cv.TM_CCORR)
# 获得最匹配地方的左上角坐标min_val, max_val, min_loc, max_loc=cv.minMaxLoc(res)
top_left=max_loc# 计算最匹配地方的右下角坐标bottom_right= (top_left[0] +w, top_left[1] +h)
# 框出身份证号区域并展示cv.rectangle(idimg, top_left, bottom_right, (0, 255, 0), 2)
cv.imshow("idimgOK", idimg)
# 展示身份证号码的二值图像rectangleid=cv.resize(idimgok[top_left[1] -2:bottom_right[1] +2, top_left[0] -2:bottom_right[0] +2], (436, 36),
interpolation=cv.INTER_CUBIC)
# rectangleid = cv.erode(rectangleid,kernel2)cv.imshow("rectangleid", rectangleid)
text=pytesseract.image_to_string(rectangleid)
print(text)
cv.waitKey(0)

程序中所用到的图片

0033.jpg为标准身份证照片

                                                                    position1.jpg

相关文章
|
9天前
|
机器学习/深度学习 算法 TensorFlow
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作界面,实现用户上传一张动物图片,识别其名称。
35 1
动物识别系统Python+卷积神经网络算法+TensorFlow+人工智能+图像识别+计算机毕业设计项目
|
8天前
|
机器学习/深度学习 人工智能 算法
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
55 21
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面
|
8天前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
51 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
|
8天前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
37 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
4天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
18 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
1天前
|
大数据 UED 开发者
实战演练:利用Python的Trie树优化搜索算法,性能飙升不是梦!
在数据密集型应用中,高效搜索算法至关重要。Trie树(前缀树/字典树)通过优化字符串处理和搜索效率成为理想选择。本文通过Python实战演示Trie树构建与应用,显著提升搜索性能。Trie树利用公共前缀减少查询时间,支持快速插入、删除和搜索。以下为简单示例代码,展示如何构建及使用Trie树进行搜索与前缀匹配,适用于自动补全、拼写检查等场景,助力提升应用性能与用户体验。
9 2
|
4天前
|
算法 Python
震惊!Python 算法设计背后,时间复杂度与空间复杂度的惊天秘密大起底!
在 Python 算法设计中,理解并巧妙运用时间复杂度和空间复杂度的知识,是实现高效、优雅代码的必经之路。通过不断地实践和优化,我们能够在这两个因素之间找到最佳的平衡点,创造出性能卓越的程序。
19 4
|
5天前
|
算法 搜索推荐 开发者
别再让复杂度拖你后腿!Python 算法设计与分析实战,教你如何精准评估与优化!
在 Python 编程中,算法的性能至关重要。本文将带您深入了解算法复杂度的概念,包括时间复杂度和空间复杂度。通过具体的例子,如冒泡排序算法 (`O(n^2)` 时间复杂度,`O(1)` 空间复杂度),我们将展示如何评估算法的性能。同时,我们还会介绍如何优化算法,例如使用 Python 的内置函数 `max` 来提高查找最大值的效率,或利用哈希表将查找时间从 `O(n)` 降至 `O(1)`。此外,还将介绍使用 `timeit` 模块等工具来评估算法性能的方法。通过不断实践,您将能更高效地优化 Python 程序。
20 4
|
3天前
|
算法 程序员 Python
程序员必看!Python复杂度分析全攻略,让你的算法设计既快又省内存!
在编程领域,Python以简洁的语法和强大的库支持成为众多程序员的首选语言。然而,性能优化仍是挑战。本文将带你深入了解Python算法的复杂度分析,从时间与空间复杂度入手,分享四大最佳实践:选择合适算法、优化实现、利用Python特性减少空间消耗及定期评估调整,助你写出高效且节省内存的代码,轻松应对各种编程挑战。
15 1
|
4天前
|
算法 计算机视觉 Python
Python并查集大揭秘:让你在算法界呼风唤雨,秒杀一切复杂场景!
在编程与算法的广袤天地中,总有一些工具如同神兵利器,能够助你一臂之力,在复杂的问题前游刃有余。今天,我们就来深入探讨这样一件神器——Python并查集(Union-Find),看看它是如何让你在算法界呼风唤雨,轻松应对各种复杂场景的。
15 2