OCR技术在日常生活中和人脸识别功能一样,是最常见的一种技术。
这里记录一下,OCR学习的全过程。
一、介绍
OCR识别分为两部分,一是检测出文字,二是识别出文字。
PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。
PaddleOCR是一款文本识别效果不输于商用的Python库!在RV1126上也部署成功了。后续将部署到RK3568等NPU板子上。
二、环境创建
使用的是AutoDL云平台,租了一台3060的GPU,价格是1.58元/小时,还是比较划算的,也可以使用其他的。
1、环境搭建
# 创建
conda create -n paddle python=3.8
# 激活
conda activate paddle
2、下载paddleocr
git clone https://github.com/PaddlePaddle/PaddleOCR.git
3、安装轮子
cd PaddleOCR
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
1)安装出错:
Building wheel for lanms-neo (pyproject.toml) ... error error: subprocess-exited-with-error
处理:
解决PaddleOCR安装lanms-neo时报错,Could not build wheels for lanms-neo ..._樱阙诗汀的博客-CSDN博客
2)出错:
ERROR: Failed building wheel for Polygon3
处理
打开网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/,下载Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl
安装
pip install Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
3)出错:
ERROR: Failed building wheel for lanms-neo
处理
报错ERROR: Could not build wheels for lanms-neo导致Failed to build lanms-neo情况之一分析与解决_星晴的蜗牛的博客-CSDN博客
4、标记样本
1)安装paddlepaddle:
开始使用_飞桨-源于产业实践的开源深度学习平台
使用的是CPU的安装方式, 因为仅仅用于标记:
# 安装paddle
pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
# 验证安装
安装完成后您可以使用 python 进入 python 解释器,输入import paddle ,再输入 paddle.utils.run_check()
如果出现PaddlePaddle is installed successfully!,说明您已成功安装。
#卸载
python -m pip uninstall paddlepaddle
安装好paddlepadle之后,
2)启动标注工具
# 安装标注工具
cd PaddleOCR/PPOCRLabel
python setup.py bdist_wheel
pip install .\dist\PPOCRLabel-2.1.3-py2.py3-none-any.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
PPOCRLabel --lang ch
打开PPOCRLabel
PPOCRLabel --lang ch
3)PPOCRLabel使用说明
PPOCRLabel使用自行了解
5、测试
PaddleOCR提供了一系列测试图片,点击这里下载并解压
下载地址
https://paddleocr.bj.bcebos.com/dygraph_v2.1/ppocr_img.zip
执行测试
paddleocr --image_dir ./ppocr_img/imgs/11.jpg --use_angle_cls true --use_gpu false
运行正常