前言
什么是OCR?
光学字符识别(Optical Character Recognition, OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。简而言之,检测图像中的文本资料,并且识别出文本的内容。
那么有哪些应用场景呢?
其实我们日常生活中处处都有ocr的影子,比如在疫情期间身份证识别录入信息、车辆车牌号识别、自动驾驶等。我们的生活中,机器学习已经越来越多的扮演着重要角色,也不再是神秘的东西。
OCR的技术路线是什么呢?
ocr的运行方式如下图,输入->图像预处理->文字检测->文本识别->输出。
本文主要是介绍一个博主使用的比较好的OCR开源项目,在这里分享给大家——PaddleOCR。
项目Github地址: PaddleOCR地址
我会按照刚接触的状态,梳理一下验证使用该项目的过程。
项目使用
先把项目从github上clone下来,慢慢分析。
项目结构
首先我们看一下项目的构造。
发现项目有中文的介绍说明,这就很方便了,点开按照官方的说明开始操作。
环境部署
点开README.md,,可以从文档教程中看到第一步就是教你如何安装环境。
由于内容过多,我就做个概括,方便大家直接上手。
1、安装Anaconda,构造虚拟环境
这里可以参考我的另一篇文章,里面很详细:机器学习基础环境部署 | 机器学习系列_阿良的博客-CSDN博客_机器学习 环境搭建
官方给的是python3.8的虚拟环境,我们也构造一个,打开Anaconda Prompt。
输入命令:
conda create -n paddle_env python=3.8
激活环境:
conda activate paddle_env
2、依赖包下载
paddlepaddle安装
pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
layoutparser安装
pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl
Shapely安装,这个需要下载,下载地址:Shapely下载地址
我选的是这个
安装命令:
pip install Shapely-1.8.0-cp38-cp38-win_amd64.whl
paddleocr安装
pip install paddleocr -i https://mirror.baidu.com/pypi/simple
好的,环境有点多,都安装好了就开始上手使用吧。




