AI计算机视觉笔记二十:PaddleOCR环境搭建及测试

简介: OCR技术广泛应用于日常生活中,与人脸识别一样常见。PaddleOCR是一个基于飞桨的OCR工具库,具有超轻量级中文OCR模型,支持中英文数字组合、竖排及长文本识别。本文档详细介绍了PaddleOCR的学习过程,包括环境搭建、安装、样本标注及测试步骤。使用AutoDL云平台进行环境创建,并提供了详细的命令行操作指南,帮助用户顺利完成PaddleOCR的部署与测试。

OCR技术在日常生活中和人脸识别功能一样,是最常见的一种技术。

这里记录一下,OCR学习的全过程。

一、介绍

OCR识别分为两部分,一是检测出文字,二是识别出文字。

PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。

PaddleOCR是一款文本识别效果不输于商用的Python库!在RV1126上也部署成功了。后续将部署到RK3568等NPU板子上。

二、环境创建

使用的是AutoDL云平台,租了一台3060的GPU,价格是1.58元/小时,还是比较划算的,也可以使用其他的。

1、环境搭建

# 创建
conda create -n paddle python=3.8
# 激活
conda activate paddle

2、下载paddleocr

git clone https://github.com/PaddlePaddle/PaddleOCR.git

3、安装轮子

cd PaddleOCR
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

1)安装出错:
Building wheel for lanms-neo (pyproject.toml) ... error error: subprocess-exited-with-error

处理:

解决PaddleOCR安装lanms-neo时报错,Could not build wheels for lanms-neo ..._樱阙诗汀的博客-CSDN博客

2)出错:
ERROR: Failed building wheel for Polygon3

处理

打开网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/,下载Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl

安装


pip install Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple

3)出错:
ERROR: Failed building wheel for lanms-neo

处理

报错ERROR: Could not build wheels for lanms-neo导致Failed to build lanms-neo情况之一分析与解决_星晴的蜗牛的博客-CSDN博客

4、标记样本

1)安装paddlepaddle:

开始使用_飞桨-源于产业实践的开源深度学习平台

使用的是CPU的安装方式, 因为仅仅用于标记:

# 安装paddle
pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
​
# 验证安装
安装完成后您可以使用 python 进入 python 解释器,输入import paddle ,再输入 paddle.utils.run_check()
如果出现PaddlePaddle is installed successfully!,说明您已成功安装。
#卸载
python -m pip uninstall paddlepaddle
安装好paddlepadle之后,

2)启动标注工具

# 安装标注工具
cd PaddleOCR/PPOCRLabel
​
python setup.py bdist_wheel 
​
pip install .\dist\PPOCRLabel-2.1.3-py2.py3-none-any.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
​
PPOCRLabel --lang ch
打开PPOCRLabel

PPOCRLabel --lang ch

3)PPOCRLabel使用说明

PPOCRLabel使用自行了解

5、测试

PaddleOCR提供了一系列测试图片,点击这里下载并解压

下载地址

https://paddleocr.bj.bcebos.com/dygraph_v2.1/ppocr_img.zip

执行测试

paddleocr --image_dir ./ppocr_img/imgs/11.jpg --use_angle_cls true --use_gpu false

运行正常

相关文章
|
5月前
|
人工智能 自然语言处理 测试技术
从人工到AI驱动:天猫测试全流程自动化变革实践
天猫技术质量团队探索AI在测试全流程的落地应用,覆盖需求解析、用例生成、数据构造、执行验证等核心环节。通过AI+自然语言驱动,实现测试自动化、可溯化与可管理化,在用例生成、数据构造和执行校验中显著提效,推动测试体系从人工迈向AI全流程自动化,提升效率40%以上,用例覆盖超70%,并构建行业级知识资产沉淀平台。
从人工到AI驱动:天猫测试全流程自动化变革实践
|
5月前
|
数据采集 存储 人工智能
从0到1:天猫AI测试用例生成的实践与突破
本文系统阐述了天猫技术团队在AI赋能测试领域的深度实践与探索,讲述了智能测试用例生成的落地路径。
从0到1:天猫AI测试用例生成的实践与突破
|
6月前
|
人工智能 数据可视化 测试技术
AI测试平台自动遍历:低代码也能玩转全链路测试
AI测试平台的自动遍历功能,通过低代码配置实现Web和App的自动化测试。用户只需提供入口链接或安装包及简单配置,即可自动完成页面结构识别、操作验证,并生成可视化报告,大幅提升测试效率,特别适用于高频迭代项目。
|
6月前
|
人工智能 测试技术 调度
写用例写到怀疑人生?AI 智能测试平台帮你一键生成!
霍格沃兹测试开发学社推出AI智能测试用例生成功能,结合需求文档一键生成高质量测试用例,大幅提升效率,减少重复劳动。支持自定义提示词、多文档分析与批量管理,助力测试人员高效完成测试设计,释放更多时间投入核心分析工作。平台已开放内测,欢迎体验!
|
6月前
|
存储 人工智能 测试技术
用AI提升测试效率:智能体平台的「需求文档管理」功能上线啦!
霍格沃兹测试开发学社推出AI智能体测试平台,全新「需求文档管理」功能助力高效测试准备。集中管理需求文档,支持多种上传方式,智能生成测试用例,提升测试效率与准确性,助力迈向智能化测试新时代。
|
6月前
|
人工智能 JavaScript 算法
Playwright携手MCP:AI智能体实现自主化UI回归测试
MCP 协议使得 AI 能够通过 Playwright 操作浏览器,其中快照生成技术将页面状态转化为 LLM 可理解的文本,成为驱动自动化测试的关键。该方式适用于探索性测试和快速验证,但目前仍面临快照信息缺失、元素定位不稳定、成本高、复杂场景适应性差以及结果确定性不足等挑战。人机协同被认为是未来更可行的方向,AI 负责执行固定流程,人类则专注策略与验证。
|
7月前
|
存储 人工智能 算法
AI测试平台实战:深入解析自动化评分和多模型对比评测
在AI技术迅猛发展的今天,测试工程师面临着如何高效评估大模型性能的全新挑战。本文将深入探讨AI测试平台中自动化评分与多模型对比评测的关键技术与实践方法,为测试工程师提供可落地的解决方案。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
2038 8