快速部署属于自己的 OCR API

简介: 快速部署属于自己的 OCR API

背景

上篇文章我们讲解了验证码识别的最佳解决方案,今天我们把验证码识别的能力,服务化,对外输入一个OCR接口。


  • 将验证码识别服务化

部署属于自己的 OCR API

环境准备

【python>=3.6】

pip install ddddocr
pip install flask

搭建

  • 用flask搭建一个简单的后台服务
from flask import Flask, render_template, request
import ddddocr
app = Flask(__name__)
@app.route('/ocr', methods=['POST'])
def ocr_api():
    ocr = ddddocr.DdddOcr()
    img = request.files.get('image').read()
    r = ocr.classification(img)
    return ''.join(r)
if __name__ == '__main__':
    app.run(host="0.0.0.0", port=8089)
  • 启动服务
python ocr_server.py

验证

我们利用requests进行api验证,如下

直接用本地图片请求验证

import requests
api_url = "http://127.0.0.1:8089/ocr"
file = open(r'1.png', 'rb').read()
res = requests.post(api_url, files={'image': file})
print(res.text)

获取验证之后,再调用我们的识别api

  • 我们以【北京通】登录页面的验证为例
import requests
# 获取验证码图片
headers = {
    "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
     "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4195.1 Safari/537.36"
 }
resp = requests.get('https://bjt.beijing.gov.cn/renzheng/common/generateCaptcha?r=0.15605044411493973', headers=headers, verify=False)
captcha_img = resp.content
# 识别
resp = requests.post(api_url, files={'image': captcha_img})
print('验证码结果', resp.text)
# 保存验证码图片以供验证
with open('captcha.jpg', 'wb') as f:
    f.write(captcha_img)

思考&总结

「大家觉得方便高效有没有质和量的区别?」

  • 用【Tesseract OCR】进行验证码识别方不方便?也挺方便!
  • 用【百度OCR】进行验证码识别方不方便?也挺方便!
  • 用【带带弟弟OCR】进行验证码识别方不方便?好像也挺方便!

就经常问人,如果这三种方式能给够同样给你带来方便,也就是说这三 种方式你都欣赏过都使用过,你都觉得还不错对吧!

「那你觉得哪种方便更让你方便?」

相关文章
|
文字识别 前端开发 API
印刷文字识别操作报错合集之通过HTTPS连接到OCR服务的API时报错,该如何处理
在使用印刷文字识别(OCR)服务时,可能会遇到各种错误。例如:1.Java异常、2.配置文件错误、3.服务未开通、4.HTTP错误码、5.权限问题(403 Forbidden)、6.调用拒绝(Refused)、7.智能纠错问题、8.图片质量或格式问题,以下是一些常见错误及其可能的原因和解决方案的合集。
|
JSON 文字识别 算法
C# 通过阿里云 API 实现企业营业执照OCR识别
C# 通过阿里云 API 实现企业营业执照OCR识别
|
文字识别 安全 API
阿里云文字识别OCR的发票凭证识别功能可以通过API接口的形式进行调用
【2月更文挑战第5天】阿里云文字识别OCR的发票凭证识别功能可以通过API接口的形式进行调用
816 5
|
JSON 文字识别 API
文字识别OCR服务通常提供了一种API接口
【2月更文挑战第5天】文字识别OCR服务通常提供了一种API接口
411 4
|
文字识别 JavaScript API
Vue实现:Ctrl+V粘贴文字图片截图,调用第三方API文字识别OCR内容并进行内容分割识别填充。
Vue实现:Ctrl+V粘贴文字图片截图,调用第三方API文字识别OCR内容并进行内容分割识别填充。
Vue实现:Ctrl+V粘贴文字图片截图,调用第三方API文字识别OCR内容并进行内容分割识别填充。
|
机器学习/深度学习 文字识别 算法
一文看懂驾驶证识别OCR:从算法到 API 接入代码
随着技术的进一步发展,驾驶证识别 OCR 将继续优化和改进,提升准确性、速度和适应性。它将在智能交通系统、数字化政府服务和商业应用等领域发挥更重要的作用
722 0
|
文字识别 监控 Java
一文看懂车牌识别OCR:从技术原理到 API Java 示例代码接入
一文看懂车牌识别OCR:从技术原理到 API Java 示例代码接入
1113 0
一文看懂车牌识别OCR:从技术原理到 API Java 示例代码接入
|
机器学习/深度学习 文字识别 算法
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
1794 0
一文看懂增值税发票识别OCR:从技术原理到 API Java 示例代码接入
|
文字识别 算法 Java
看懂二维码识别OCR:从算法到 API Java 接入代码
看懂二维码识别OCR:从算法到API 接入代码
8719 0
|
人工智能 文字识别 开发工具
印刷文字识别使用问题之是否支持识别并返回文字在图片中的位置信息
印刷文字识别产品,通常称为OCR(Optical Character Recognition)技术,是一种将图像中的印刷或手写文字转换为机器编码文本的过程。这项技术广泛应用于多个行业和场景中,显著提升文档处理、信息提取和数据录入的效率。以下是印刷文字识别产品的一些典型使用合集。