使用pyocr和tesseract 来解析数字图片

简介: 使用pyocr和tesseract 来解析数字图片

获取图片中的数字


因为最近要抓取的网站中有参数是在图片里面, 所以就需要来解析图片来获取参数, 图片清楚的话识别率是100%, 发出来工大家参考一下

前期准备

1 pip install pyocr

2 brew install tesseract 安装参考博客 https://www.jianshu.com/p/719c053f170b

3 pip3.6 install -i https://pypi.tuna.tsinghua.edu.cn/simple pillow 用镜像安装pillow

##实现代码
from urllib import request
from PIL import Image
import pyocr
import pyocr.builders
url = 'http://*******.png'
#获取图片后10为作为图片名
bug = url[-10:]
path = f"/tmp/{bug}"
#下载图片
request.urlretrieve(url, path)
#获取里面的数字
nums = self.pic_num(pic=path)
#删除图片
os.remove(path)
def pic_num(self, pic):
    try:
        tools = pyocr.get_available_tools()
        print(tools)
        if len(tools) == 0:
            print("No OCR tool found")
        tool = tools[0]
        txt = tool.image_to_string(
            Image.open(pic),
            lang="eng",
            builder=pyocr.builders.TextBuilder(tesseract_layout=6)
        )
        print(txt)
        return txt
    except Exception as e:
        print('获取数字失败', e)


目录
相关文章
|
存储 编解码 Java
图片Exif信息解析(Java实现)
图片Exif信息解析(Java实现)
|
6天前
|
存储 算法 编译器
【ffmpeg 到Qt的图片格式转换】精彩的像素:深入解析 AVFrame 到 QImage 的转换
【ffmpeg 到Qt的图片格式转换】精彩的像素:深入解析 AVFrame 到 QImage 的转换
62 0
|
6天前
|
开发工具 数据安全/隐私保护 Android开发
视觉智能平台常见问题之图片解析出的水印图判断是自己添加的水印图如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
35 1
|
10月前
|
移动开发 JavaScript 前端开发
数据可视化大屏百度地图手机端标注开发实战案例解析(jsAPI接口、标注分类图片、文本标签、分类筛选、自适应高度信息弹窗、PHP后端API)
数据可视化大屏百度地图手机端标注开发实战案例解析(jsAPI接口、标注分类图片、文本标签、分类筛选、自适应高度信息弹窗、PHP后端API)
148 0
|
9月前
|
Web App开发 数据采集 人工智能
|
JavaScript
js: 从base64编码中解析图片信息
js: 从base64编码中解析图片信息
193 0
webpack基础篇(七):资源解析--解析图片
webpack基础篇(七):资源解析--解析图片
90 0
webpack基础篇(七):资源解析--解析图片
|
JavaScript 前端开发 Java
Vue解析剪切板图片并实现发送功能
Vue解析剪切板图片并实现发送功能
|
存储 Linux 程序员
万字 + 图片解析Linux【基础篇1】
万字 + 图片解析Linux【基础篇1】
万字 + 图片解析Linux【基础篇1】
|
4天前
|
Linux 网络安全 Windows
网络安全笔记-day8,DHCP部署_dhcp搭建部署,源码解析
网络安全笔记-day8,DHCP部署_dhcp搭建部署,源码解析

推荐镜像

更多