AI计算机视觉笔记二十:PaddleOCR环境搭建及测试

简介: OCR技术广泛应用于日常生活中,与人脸识别一样常见。PaddleOCR是一个基于飞桨的OCR工具库,具有超轻量级中文OCR模型,支持中英文数字组合、竖排及长文本识别。本文档详细介绍了PaddleOCR的学习过程,包括环境搭建、安装、样本标注及测试步骤。使用AutoDL云平台进行环境创建,并提供了详细的命令行操作指南,帮助用户顺利完成PaddleOCR的部署与测试。

OCR技术在日常生活中和人脸识别功能一样,是最常见的一种技术。

这里记录一下,OCR学习的全过程。

一、介绍

OCR识别分为两部分,一是检测出文字,二是识别出文字。

PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。

PaddleOCR是一款文本识别效果不输于商用的Python库!在RV1126上也部署成功了。后续将部署到RK3568等NPU板子上。

二、环境创建

使用的是AutoDL云平台,租了一台3060的GPU,价格是1.58元/小时,还是比较划算的,也可以使用其他的。

1、环境搭建

# 创建
conda create -n paddle python=3.8
# 激活
conda activate paddle

2、下载paddleocr

git clone https://github.com/PaddlePaddle/PaddleOCR.git

3、安装轮子

cd PaddleOCR
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

1)安装出错:
Building wheel for lanms-neo (pyproject.toml) ... error error: subprocess-exited-with-error

处理:

解决PaddleOCR安装lanms-neo时报错,Could not build wheels for lanms-neo ..._樱阙诗汀的博客-CSDN博客

2)出错:
ERROR: Failed building wheel for Polygon3

处理

打开网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/,下载Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl

安装


pip install Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple

3)出错:
ERROR: Failed building wheel for lanms-neo

处理

报错ERROR: Could not build wheels for lanms-neo导致Failed to build lanms-neo情况之一分析与解决_星晴的蜗牛的博客-CSDN博客

4、标记样本

1)安装paddlepaddle:

开始使用_飞桨-源于产业实践的开源深度学习平台

使用的是CPU的安装方式, 因为仅仅用于标记:

# 安装paddle
pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
​
# 验证安装
安装完成后您可以使用 python 进入 python 解释器,输入import paddle ,再输入 paddle.utils.run_check()
如果出现PaddlePaddle is installed successfully!,说明您已成功安装。
#卸载
python -m pip uninstall paddlepaddle
安装好paddlepadle之后,

2)启动标注工具

# 安装标注工具
cd PaddleOCR/PPOCRLabel
​
python setup.py bdist_wheel 
​
pip install .\dist\PPOCRLabel-2.1.3-py2.py3-none-any.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
​
PPOCRLabel --lang ch
打开PPOCRLabel

PPOCRLabel --lang ch

3)PPOCRLabel使用说明

PPOCRLabel使用自行了解

5、测试

PaddleOCR提供了一系列测试图片,点击这里下载并解压

下载地址

https://paddleocr.bj.bcebos.com/dygraph_v2.1/ppocr_img.zip

执行测试

paddleocr --image_dir ./ppocr_img/imgs/11.jpg --use_angle_cls true --use_gpu false

运行正常

相关文章
|
4天前
|
人工智能 数据可视化 API
10 分钟构建 AI 客服并应用到网站、钉钉或微信中测试评
10 分钟构建 AI 客服并应用到网站、钉钉或微信中测试评
21 2
|
9天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
3天前
|
缓存 Java 测试技术
谷粒商城笔记+踩坑(11)——性能压测和调优,JMeter压力测试+jvisualvm监控性能+资源动静分离+修改堆内存
使用JMeter对项目各个接口进行压力测试,并对前端进行动静分离优化,优化三级分类查询接口的性能
谷粒商城笔记+踩坑(11)——性能压测和调优,JMeter压力测试+jvisualvm监控性能+资源动静分离+修改堆内存
|
9天前
|
机器学习/深度学习 人工智能 PyTorch
AI计算机视觉笔记三十二:LPRNet车牌识别
LPRNet是一种基于Pytorch的高性能、轻量级车牌识别框架,适用于中国及其他国家的车牌识别。该网络无需对字符进行预分割,采用端到端的轻量化设计,结合了squeezenet和inception的思想。其创新点在于去除了RNN,仅使用CNN与CTC Loss,并通过特定的卷积模块提取上下文信息。环境配置包括使用CPU开发板和Autodl训练环境。训练和测试过程需搭建虚拟环境并安装相关依赖,执行训练和测试脚本时可能遇到若干错误,需相应调整代码以确保正确运行。使用官方模型可获得较高的识别准确率,自行训练时建议增加训练轮数以提升效果。
|
9天前
|
人工智能 开发工具 计算机视觉
AI计算机视觉笔记三十:yolov8_obb旋转框训练
本文介绍了如何使用AUTODL环境搭建YOLOv8-obb的训练流程。首先创建虚拟环境并激活,然后通过指定清华源安装ultralytics库。接着下载YOLOv8源码,并使用指定命令开始训练,过程中可能会下载yolov8n.pt文件。训练完成后,可使用相应命令进行预测测试。
|
7天前
|
机器学习/深度学习 人工智能 测试技术
探索软件测试的未来:AI与自动化的融合之路
【9月更文挑战第9天】随着技术的飞速发展,软件测试领域正经历着一场革命。本文将深入探讨人工智能(AI)和自动化技术如何重塑软件测试的未来,提升测试效率,确保软件质量。我们将从AI在测试中的应用、自动化测试的优势,到两者结合带来的创新方法进行详细分析,旨在为读者提供一条清晰的路径,以理解并利用这些先进技术优化测试流程。
|
9天前
|
人工智能 并行计算 测试技术
AI计算机视觉笔记三十一:基于UNetMultiLane的多车道线等识别
该项目基于开源数据集 VIL100 实现了 UNetMultiLane,用于多车道线及车道线类型的识别。数据集中标注了六个车道的车道线及其类型。项目详细记录了从环境搭建到模型训练与测试的全过程,并提供了在 CPU 上进行训练和 ONNX 转换的代码示例。训练过程约需 4 小时完成 50 个 epoch。此外,还实现了视频检测功能,可在视频中实时识别车道线及其类型。
|
9天前
|
人工智能 监控 算法
AI计算机视觉笔记二十 八:基于YOLOv8实例分割的DeepSORT多目标跟踪
本文介绍了YOLOv8实例分割与DeepSORT视觉跟踪算法的结合应用,通过YOLOv8进行目标检测分割,并利用DeepSORT实现特征跟踪,在复杂环境中保持目标跟踪的准确性与稳定性。该技术广泛应用于安全监控、无人驾驶等领域。文章提供了环境搭建、代码下载及测试步骤,并附有详细代码示例。
|
5天前
|
机器学习/深度学习 人工智能 测试技术
探索软件测试的未来之路:AI与自动化的交汇点
在数字时代的浪潮中,软件测试作为保障产品质量的关键步骤,正面临前所未有的挑战与机遇。本文将带你一探究竟,从AI技术如何革新传统测试流程,到自动化测试工具的崛起,再到这两者如何共同塑造软件测试的未来。我们将通过具体案例,揭示这一变革如何影响测试工程师的角色,以及测试流程的效率和效果。准备好跟随我,一起走进智能测试的新纪元吧!
|
4月前
|
机器学习/深度学习 计算机视觉
AIGC核心技术——计算机视觉(CV)预训练大模型
【1月更文挑战第13天】AIGC核心技术——计算机视觉(CV)预训练大模型
540 3
AIGC核心技术——计算机视觉(CV)预训练大模型

热门文章

最新文章