验证码识别最佳方案,你不来试试?

本文涉及的产品
票证核验,票证核验 50次/账号
小语种识别,小语种识别 200次/月
个人证照识别,个人证照识别 200次/月
简介: 验证码识别最佳方案,你不来试试?

背景

UI自动化测试-验证码识别

验证码分析:图片上有折线,验证码有数字,有英文字母大小写,分类的时候需要更多的样本,验证码的字母是彩色的,图片上有雪花等噪点,因此识别改验证码难度较大。


方案对比

Tesseract OCR

  • 缺点:这个安装比较麻烦,对新手不太友好,各个系统,不同的python环境下,坑比较多;需要额外设置环境变量等。

「我敢保证你一次肯定安装不成功」哈哈哈哈。

  • 优点:是免费,较为易用;但其识别精度一般。


百度OCR

  • 缺点:需要进行一系列的配置,新手一次搞不定;免费的api有调用次数限制而且需要联网【有限制】;离线sdk需要购买。
  • 优点:识别准确率高


带带弟弟OCR

  • 缺点:暂时没有缺点,和以上两个ocr相比;免费的忽略缺点【哈哈哈哈哈】
  • 优点:「开箱即用,安装简单,大力推荐,识别率高」


实际操作

安装

安装过程相当简单,不会出现任何报错,版本不兼容的情况【python>=3.6】

pip install ddddocr


展示代码

# -*- coding: utf-8 -*-
"""
@Project :demo 
@File    :test_ocr.py
@Author  :lijiawei
@Date    :2021/8/10 8:45 上午 
"""
import ddddocr
def magic_ocr(img_path):
    """
    ocr 识别
    :param img_path: 验证码图片路径
    :return: 
    """
    ocr = ddddocr.DdddOcr()
    with open(img_path, 'rb') as f:
        img_bytes = f.read()
    return ocr.classification(img_bytes)


实战

  • 我们以【北京通】登录页面的验证为例
  • 识别结果
1774
Process finished with exit code 0


验证码样本

用我们的验证码样本实战,平均识别速度在100ms以内,识别率100%

思考&反问

「大家觉得方便高效有没有质和量的区别?」

  • 用【Tesseract OCR】进行验证码识别方不方便?也挺方便!
  • 用【百度OCR】进行验证码识别方不方便?也挺方便!
  • 用【带带弟弟OCR】进行验证码识别方不方便?好像也挺方便!

就经常问人,如果这三种方式能给够同样给你带来方便,也就是说这三 种方式你都欣赏过都使用过,你都觉得还不错对吧!

「那你觉得哪种方便更让你方便?」


总而言之,如果你需要进行验证码识别,以上3种识别方案都尝试过, 那么,带带弟弟OCR(ddddocr)这个库一定是你的首选方案~

下集预告

  • 将验证码识别服务化

部署属于自己的 OCR API

相关文章
|
2月前
|
人工智能 安全 IDE
【AI帮我写代码,上班摸鱼不是梦】手摸手图解CodeWhisperer的安装使用
除了借助ChatGPT通过问答的方式生成代码,也可以通过IDEA插件在写代码是直接帮助我们生成代码。 目前,IDEA插件有CodeGeeX、CodeWhisperer、Copilot。其中,CodeGeeX和CodeWhisperer是完全免费的,Copilot是收费的,每月10美元。 下面我们来了解CodeWhisperer的安装和使用,如果你还想了解其他的可以在评论告诉我。
142 4
|
11月前
|
开发工具 Python
为了追学姐,用python把她的照片做成了拼图游戏,她看了...
为了追学姐,用python把她的照片做成了拼图游戏,她看了...
120 0
|
11月前
|
数据采集 人工智能 安全
ChatGPT显示付费墙内容,OpenAI把联网功能关了,网友炸了
ChatGPT显示付费墙内容,OpenAI把联网功能关了,网友炸了
135 0
|
12月前
|
小程序 Windows
电脑可以刷微信朋友圈,这下能更好地摸鱼了?
电脑可以刷微信朋友圈,这下能更好地摸鱼了?
|
12月前
|
搜索推荐 小程序 程序员
看过很多教程,却依然写不好一个程序,怎么破?
最近在和学员的沟通中,发现不少初学者面临这样一个问题:了解了一些基本的语法,看得懂书上的示例,但是面临一个新的编程问题时,依然感到无从下手。
|
uml 开发者 Windows
推荐5款冷门小工具,看一看有没有你喜欢的?
每个人的电脑中都会安装很多软件,可能还保留着很多不为人知的冷门软件。不过虽然冷门,但绝不意味着低能,相反很多冷门软件的功能十分出色。闲话少说,接下来我就给大家推荐5款冷门小工具,看一看有没有你喜欢的。
159 0
推荐5款冷门小工具,看一看有没有你喜欢的?
|
存储 机器学习/深度学习 算法
大逆不道,从天界偷下来的算法修仙秘籍竟然传到你手上~~(结尾有彩蛋)
这有可能是你见过最离谱的标题 这有可能是你没见过的技术文章模式 我不知道我的选择是否正确,但是我的想法就是: 不再让技术冷冰冰,让所有人学习中获得快乐!
229 1
|
前端开发 网络协议 JavaScript
我最近在用的一款神器,功能多到炸
今天就给大家分享我最近开发时在用的一款神器,API管理和自动化测试工具Eolink。想要摸鱼,就要提高效率,想要提高效率,就用这款神器!
186 0
我最近在用的一款神器,功能多到炸
|
API 网络架构 Python
偷个懒,公号抠腚早报80%自动化——3.Flask速成大法(上)
本节就来过一过Flask,下一节再来利用Flask来写API接口和 静态页面,以及直接生成公号文章样式。
121 0
|
存储 SQL 关系型数据库
偷个懒,公号抠腚早报80%自动化——3.Flask速成大法(下)
本节就来过一过Flask,下一节再来利用Flask来写API接口和 静态页面,以及直接生成公号文章样式。
105 0