AI计算机视觉笔记二十:PaddleOCR环境搭建及测试

简介: OCR技术广泛应用于日常生活中,与人脸识别一样常见。PaddleOCR是一个基于飞桨的OCR工具库,具有超轻量级中文OCR模型,支持中英文数字组合、竖排及长文本识别。本文档详细介绍了PaddleOCR的学习过程,包括环境搭建、安装、样本标注及测试步骤。使用AutoDL云平台进行环境创建,并提供了详细的命令行操作指南,帮助用户顺利完成PaddleOCR的部署与测试。

OCR技术在日常生活中和人脸识别功能一样,是最常见的一种技术。

这里记录一下,OCR学习的全过程。

一、介绍

OCR识别分为两部分,一是检测出文字,二是识别出文字。

PaddleOCR: 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别。

PaddleOCR是一款文本识别效果不输于商用的Python库!在RV1126上也部署成功了。后续将部署到RK3568等NPU板子上。

二、环境创建

使用的是AutoDL云平台,租了一台3060的GPU,价格是1.58元/小时,还是比较划算的,也可以使用其他的。

1、环境搭建

# 创建
conda create -n paddle python=3.8
# 激活
conda activate paddle

2、下载paddleocr

git clone https://github.com/PaddlePaddle/PaddleOCR.git

3、安装轮子

cd PaddleOCR
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

1)安装出错:
Building wheel for lanms-neo (pyproject.toml) ... error error: subprocess-exited-with-error

处理:

解决PaddleOCR安装lanms-neo时报错,Could not build wheels for lanms-neo ..._樱阙诗汀的博客-CSDN博客

2)出错:
ERROR: Failed building wheel for Polygon3

处理

打开网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/,下载Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl

安装


pip install Polygon3-3.0.9.1-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple

3)出错:
ERROR: Failed building wheel for lanms-neo

处理

报错ERROR: Could not build wheels for lanms-neo导致Failed to build lanms-neo情况之一分析与解决_星晴的蜗牛的博客-CSDN博客

4、标记样本

1)安装paddlepaddle:

开始使用_飞桨-源于产业实践的开源深度学习平台

使用的是CPU的安装方式, 因为仅仅用于标记:

# 安装paddle
pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
​
# 验证安装
安装完成后您可以使用 python 进入 python 解释器,输入import paddle ,再输入 paddle.utils.run_check()
如果出现PaddlePaddle is installed successfully!,说明您已成功安装。
#卸载
python -m pip uninstall paddlepaddle
安装好paddlepadle之后,

2)启动标注工具

# 安装标注工具
cd PaddleOCR/PPOCRLabel
​
python setup.py bdist_wheel 
​
pip install .\dist\PPOCRLabel-2.1.3-py2.py3-none-any.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
​
PPOCRLabel --lang ch
打开PPOCRLabel

PPOCRLabel --lang ch

3)PPOCRLabel使用说明

PPOCRLabel使用自行了解

5、测试

PaddleOCR提供了一系列测试图片,点击这里下载并解压

下载地址

https://paddleocr.bj.bcebos.com/dygraph_v2.1/ppocr_img.zip

执行测试

paddleocr --image_dir ./ppocr_img/imgs/11.jpg --use_angle_cls true --use_gpu false

运行正常

相关文章
|
10月前
|
人工智能 API 开发者
用Qwen3+MCPs实现AI自动发布小红书笔记!支持图文和视频
魔搭自动发布小红书MCP,是魔搭开发者小伙伴实现的小红书笔记自动发布器,可以通过这个MCP自动完成小红书标题、内容和图片的发布。
3298 41
|
10月前
|
Web App开发 人工智能 JSON
Windows版来啦!Qwen3+MCPs,用AI自动发布小红书图文/视频笔记!
上一篇用 Qwen3+MCPs实现AI自动发小红书的最佳实践 有超多小伙伴关注,同时也排队在蹲Windows版本的教程。
1849 1
|
存储 数据可视化 测试技术
一个测试工程师的实战笔记:我是如何在Postman和Apipost之间做出选择的?
优秀的API测试工具应该具备: 分层设计:既有可视化操作,也开放代码层深度定制 场景感知:自动识别加密需求推荐处理方案 协议包容:不强迫开发者为了不同协议切换工具 数据主权:允许自主选择数据存储位置
375 7
|
人工智能 自然语言处理 搜索推荐
Open Notebook:开源 AI 笔记工具,支持多种文件格式,自动转播客和生成总结,集成搜索引擎等功能
Open Notebook 是一款开源的 AI 笔记工具,支持多格式笔记管理,并能自动将笔记转换为博客或播客,适用于学术研究、教育、企业知识管理等多个场景。
1851 0
Open Notebook:开源 AI 笔记工具,支持多种文件格式,自动转播客和生成总结,集成搜索引擎等功能
|
机器学习/深度学习 弹性计算 自然语言处理
前端大模型应用笔记(二):最新llama3.2小参数版本1B的古董机测试 - 支持128K上下文,表现优异,和移动端更配
llama3.1支持128K上下文,6万字+输入,适用于多种场景。模型能力超出预期,但处理中文时需加中英翻译。测试显示,其英文支持较好,中文则需改进。llama3.2 1B参数量小,适合移动端和资源受限环境,可在阿里云2vCPU和4G ECS上运行。
932 1
|
JSON 算法 数据可视化
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
这篇文章是关于如何通过算法接口返回的目标检测结果来计算性能指标的笔记。它涵盖了任务描述、指标分析(包括TP、FP、FN、TN、精准率和召回率),接口处理,数据集处理,以及如何使用实用工具进行文件操作和数据可视化。文章还提供了一些Python代码示例,用于处理图像文件、转换数据格式以及计算目标检测的性能指标。
387 0
测试专项笔记(一): 通过算法能力接口返回的检测结果完成相关指标的计算(目标检测)
|
5月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1322 56
|
6月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1257 58
|
5月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
646 30
|
5月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
649 2

热门文章

最新文章