查发票|发票查验|验证码识别|批量查验|发票验真

简介: 昨天我开始对发票查验最耗时的环节-验证码识别下手,通过使用5000多张打码图片对PaddleOCR的模型进行训练后,识别率获得了很大提升。

接着上次发票查验继续说说我这两天的进展(上一篇文章可以在我的主页中找到)。昨天开始我对耗时最大的验证码识别环节开始下手,去色前的图片如下图所示:


微信图片_20240515205226.png

通过去色处理(代码见我上一篇文章)后得到的图片如下图所示:


微信图片_20240515205231.png


可以看到,我去色后的图片也都进行了打码处理,打码我找了一家本地的公司,花了点小钱,但是后面确实能解决大问题。得到单色图片后,我就开始对PaddleOCR的开源模型进行训练,训练的过程网上也有教程我这里不再赘述,我训练所用的打码图片有5000多张,都是PaddleOCR识别结果不正确的图片,经过十几分钟的训练在评估测试中就有很好的得分。我用训练好的模型进行国税开票平台的验证码识别,发现识别率有了显著的提升,从之前的不到60%直接干到了85%左右,效果非常明显,但可能是我训练的打码图片里面包含中文字的比较少,我觉得如果打码图片能够在几万张的话,识别率估计就能95%以上了。整体单张发票的查验时间从之前的10秒减少到了6秒左右。

相关文章
|
4月前
阿里云服务器发票开具流程_发票抬头_发票常见问题解答FAQ
在阿里云开具发票,需登录用户中心访问发票管理页面。首次开票时设置发票抬头(个人/企业/事业单位),选择发票类型(增值税普通/专用)。随后选择需开票的订单并按提示操作。个人账号不可直接开企业发票,需变更实名认证。发票税率一般为6%,硬件为13%。发票抬头可修改,纸质发票邮费视情况由阿里云或用户承担,电子发票具同等法律效力且可报销。更多详情见阿里云帮助文档。
572 9
|
5月前
|
文字识别 算法 数据可视化
印刷文字识别使用问题之是否支持识别发票验真伪
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。
|
6月前
1031 查验身份证
1031 查验身份证
|
7月前
|
测试技术
发票查验,发票采集,免验证码,批量查验,系统集成,代码分享之一
发票查验-免验证码,支持批量查验,系统集成,代码分享,有测试环境,从发票采集到发票查验再到查验结果应用的闭环实现
175 0
|
7月前
您在阿里云网盘与相册服务支付后可以要求开具发票
您在阿里云网盘与相册服务支付后可以要求开具发票【1月更文挑战第13天】【1月更文挑战第62篇】
256 2
|
弹性计算 安全
阿里云发票如何开具?阿里云服务器购买之后发票开具流程及相关问题解答
开具发票是很多用户尤其是企业级用户在购买完阿里云服务器之后非常关注的问题,对于初次购买阿里云服务器的用户来说,往往并不清楚如何找阿里云开具发票,本文以图文形式为大家介绍阿里云服务器购买完成之后开具发票的详细流程。
阿里云发票如何开具?阿里云服务器购买之后发票开具流程及相关问题解答
|
机器学习/深度学习 存储 文字识别
【增值税发票识别 OCR】如何实现自动化发票管理
通过利用增值税发票识别OCR API 实现智能化的增值税发票识别、分类和归档,企业可以实现自动化的发票管理流程。这将大大提高工作效率、减少错误率,并为企业提供准确的财务数据和统计分析基础,有需要的小伙伴赶紧用起来吧~
293 0
【增值税发票识别 OCR】如何实现自动化发票管理
|
云计算 开发者
发票申请| 学习笔记
快速学习发票申请。
发票申请| 学习笔记
|
开发者
发票申请|学习笔记
快速学习发票申请
发票申请|学习笔记
免费顺丰快递单号查询电子面单api接口对接
顺丰速运快递查询接口API和电子面单接口怎么对接?除了通过顺丰自己的接口对接外,用的最多的就是第三方通过快递鸟对接了,通过顺丰单号和手机号后四位查询轨迹信息,如果是通过快递鸟下单获得的顺丰单号,可通过单号直接查询,具体下载快递鸟接口技术文档查看接口说明。
7846 0