查发票|发票查验|验证码识别|批量查验|发票验真

简介: 昨天我开始对发票查验最耗时的环节-验证码识别下手,通过使用5000多张打码图片对PaddleOCR的模型进行训练后,识别率获得了很大提升。

接着上次发票查验继续说说我这两天的进展(上一篇文章可以在我的主页中找到)。昨天开始我对耗时最大的验证码识别环节开始下手,去色前的图片如下图所示:


微信图片_20240515205226.png

通过去色处理(代码见我上一篇文章)后得到的图片如下图所示:


微信图片_20240515205231.png


可以看到,我去色后的图片也都进行了打码处理,打码我找了一家本地的公司,花了点小钱,但是后面确实能解决大问题。得到单色图片后,我就开始对PaddleOCR的开源模型进行训练,训练的过程网上也有教程我这里不再赘述,我训练所用的打码图片有5000多张,都是PaddleOCR识别结果不正确的图片,经过十几分钟的训练在评估测试中就有很好的得分。我用训练好的模型进行国税开票平台的验证码识别,发现识别率有了显著的提升,从之前的不到60%直接干到了85%左右,效果非常明显,但可能是我训练的打码图片里面包含中文字的比较少,我觉得如果打码图片能够在几万张的话,识别率估计就能95%以上了。整体单张发票的查验时间从之前的10秒减少到了6秒左右。

相关文章
|
14天前
1031 查验身份证
1031 查验身份证
|
1月前
|
测试技术
发票查验,发票采集,免验证码,批量查验,系统集成,代码分享之一
发票查验-免验证码,支持批量查验,系统集成,代码分享,有测试环境,从发票采集到发票查验再到查验结果应用的闭环实现
80 0
|
1月前
|
机器学习/深度学习 文字识别 API
文字识别OCR常见问题之发票真伪查询有接口如何解决
文字识别OCR(Optical Character Recognition)技术能够将图片或者扫描件中的文字转换为电子文本。以下是阿里云OCR技术使用中的一些常见问题以及相应的解答。
|
1月前
您在阿里云网盘与相册服务支付后可以要求开具发票
您在阿里云网盘与相册服务支付后可以要求开具发票【1月更文挑战第13天】【1月更文挑战第62篇】
85 2
|
机器学习/深度学习 存储 文字识别
【增值税发票识别 OCR】如何实现自动化发票管理
通过利用增值税发票识别OCR API 实现智能化的增值税发票识别、分类和归档,企业可以实现自动化的发票管理流程。这将大大提高工作效率、减少错误率,并为企业提供准确的财务数据和统计分析基础,有需要的小伙伴赶紧用起来吧~
205 0
【增值税发票识别 OCR】如何实现自动化发票管理
|
文字识别 API 区块链
各类发票核验查询接口说明
通过输入的发票代码(条件选填)、发票号码、开票日期、校验码(条件选填)、开票金额(条件选填),查验税票合规性。
各类发票核验查询接口说明
|
小程序 开发者
电商收付通,商户进件,上传身份证、营业执照自动识别相关信息
二级商户进件的时候,需要提交的资料不少,有一个繁琐的地方就是,不管选择哪种主体类型,都需要上传身份证人像面、身份证国徽面、身份证姓名、身份证号码、身份证居住地址、身份证开始时间和身份证结束时间这些要素。
217 0
电商收付通,商户进件,上传身份证、营业执照自动识别相关信息
L1-016 查验身份证 (15 分)
L1-016 查验身份证 (15 分)
143 0
7-54 查验身份证 (15 分)
7-54 查验身份证 (15 分)
82 0
免费顺丰快递单号查询电子面单api接口对接
顺丰速运快递查询接口API和电子面单接口怎么对接?除了通过顺丰自己的接口对接外,用的最多的就是第三方通过快递鸟对接了,通过顺丰单号和手机号后四位查询轨迹信息,如果是通过快递鸟下单获得的顺丰单号,可通过单号直接查询,具体下载快递鸟接口技术文档查看接口说明。
7570 0