如何识别图片文字，PaddleOCR机器学习开源项目使用 | 机器学习（1）

2022-06-01 649

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 如何识别图片文字，PaddleOCR机器学习开源项目使用 | 机器学习

前言

什么是OCR?

光学字符识别（Optical Character Recognition, OCR），是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。简而言之，检测图像中的文本资料，并且识别出文本的内容。

那么有哪些应用场景呢？

其实我们日常生活中处处都有ocr的影子，比如在疫情期间身份证识别录入信息、车辆车牌号识别、自动驾驶等。我们的生活中，机器学习已经越来越多的扮演着重要角色，也不再是神秘的东西。

OCR的技术路线是什么呢？

ocr的运行方式如下图，输入->图像预处理->文字检测->文本识别->输出。

本文主要是介绍一个博主使用的比较好的OCR开源项目，在这里分享给大家——PaddleOCR。

项目Github地址: PaddleOCR地址

我会按照刚接触的状态，梳理一下验证使用该项目的过程。

项目使用

先把项目从github上clone下来，慢慢分析。

项目结构

首先我们看一下项目的构造。

发现项目有中文的介绍说明，这就很方便了，点开按照官方的说明开始操作。

环境部署

点开README.md,，可以从文档教程中看到第一步就是教你如何安装环境。

由于内容过多，我就做个概括，方便大家直接上手。

1、安装Anaconda，构造虚拟环境

这里可以参考我的另一篇文章，里面很详细：机器学习基础环境部署 | 机器学习系列_阿良的博客-CSDN博客_机器学习环境搭建

官方给的是python3.8的虚拟环境，我们也构造一个，打开Anaconda Prompt。

输入命令：

conda create -n paddle_env python=3.8

激活环境：

conda activate paddle_env

2、依赖包下载

paddlepaddle安装

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

layoutparser安装

pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl

Shapely安装，这个需要下载，下载地址：Shapely下载地址

我选的是这个

安装命令：

pip install Shapely-1.8.0-cp38-cp38-win_amd64.whl

paddleocr安装

pip install paddleocr -i https://mirror.baidu.com/pypi/simple

好的，环境有点多，都安装好了就开始上手使用吧。

如何识别图片文字，PaddleOCR机器学习开源项目使用 | 机器学习（1）

前言

项目使用

项目结构

环境部署

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

如何识别图片文字，PaddleOCR机器学习开源项目使用 | 机器学习（1）

前言

项目使用

项目结构

环境部署

热门文章

最新文章

相关课程

相关电子书

相关实验场景