OCR-字符识别笔记

简介: OCR-字符识别笔记

安装

环境依赖

Linux | Windows | macOS

Python 3.7

PyTorch 1.6 或更高版本

torchvision 0.7.0

CUDA 10.1

NCCL 2

GCC 5.4.0 或更高版本

准备环境

注解

如果你已经在本地安装了 PyTorch,请直接跳转到安装步骤。

第一步 下载并安装 Miniconda.

第二步 创建并激活一个 conda 环境:

conda create --name openmmlab python=3.8 -y
conda activate openmmlab

第三步 依照官方指南,安装 PyTorch。

GPU 平台CPU 平台

conda install pytorch torchvision -c pytorch

安装步骤

我们建议大多数用户采用我们的推荐方式安装 MMOCR。倘若你需要更灵活的安装过程,则可以参考自定义安装一节。

推荐步骤

第一步 使用 MIM 安装 MMEngine, MMCV 和 MMDetection。

pip install -U openmim
mim install mmengine
mim install mmcv
mim install mmdet

第二步 安装 MMOCR.

若你需要直接运行 MMOCR 或在其基础上进行开发,则通过源码安装(推荐)。

如果你将 MMOCR 作为一个外置依赖库使用,则可以通过 MIM 安装。

源码安装MIM 安装

git clone https://github.com/ocr.git
cd mmocr
pip install -v -e .

“-v” 会让安装过程产生更详细的输出

“-e” 会以可编辑的方式安装该代码库,你对该代码库所作的任何更改都会立即生效

第三步(可选) 如果你需要使用与 albumentations 有关的变换(如 ABINet 数据流水线中的 Albu),或需要构建文档、运行单元测试的依赖,请使用以下命令安装依赖:

源码安装MIM 安装


安装 albu

pip install -r requirements/albu.txt

安装文档、测试等依赖

pip install -r requirements.txt

注解


我们建议在安装 albumentations 之后检查当前环境,确保 opencv-python 和 opencv-python-headless 没有同时被安装,否则有可能会产生一些无法预知的错误。如果它们不巧同时存在于环境当中,请卸载 opencv-python-headless 以确保 MMOCR 的可视化工具可以正常运行。


查看 albumentations 的官方文档以获知详情。


检验

你可以通过运行一个简单的推理任务来检验 MMOCR 的安装是否成功。


PythonShell

在 Python 中运行以下代码:

from mmocr.apis import MMOCRInferencer

ocr = MMOCRInferencer(det=‘DBNet’, rec=‘CRNN’)

ocr(‘demo/demo_text_ocr.jpg’, show=True, print_result=True)

若 MMOCR 的安装无误,你在这一节完成后应当能看到以图片和文字形式表示的识别结果:

识别结果

{'predictions': [{'rec_texts': ['cbanks', 'docecea', 'grouf', 'pwate', 'chobnsonsg', 'soxee', 'oeioh', 'c', 'sones', 'lbrandec', 'sretalg', '11', 'to8', 'round', 'sale', 'year',
'ally', 'sie', 'sall'], 'rec_scores': [...], 'det_polygons': [...], 'det_scores':
[...]}]}

56192f8f12f5418898bc1d1ca4cf8e66_f2d56ceb35204f55b61b46ccab06c424.png

目录
打赏
0
0
0
0
40
分享
相关文章
文本,文字识别,PaddleOCR,如何删除,PaddleOCR详解,检测,方向分类器,识别,检测的意思是检查字符的位置,查像素坐标,方向分类器,能够实现180度的图像,字符识别是把识别字符
文本,文字识别,PaddleOCR,如何删除,PaddleOCR详解,检测,方向分类器,识别,检测的意思是检查字符的位置,查像素坐标,方向分类器,能够实现180度的图像,字符识别是把识别字符
Halcon解决方案指南(18)OCR--字符识别
第18章 光学字符识别_OCR OCR(Optical Character Recongnition)即我们通常意义上讲的光学字符识别。在HALCON中,OCR常被用来分割区域及读取识别图像中的字符含义。
8323 0
Star33.1k!推荐一个基于网页的OCR(光学字符识别)引擎库
想要在前端解决图像识别的兄弟,可以到 Github 上下载Tesseract.js库,安装和相关学习文档都能下载到,实在获取不到的兄弟找V哥发给你,假期第二天,出去放松的同时也可以看看 V 哥的文章,祝大家玩得开心。
171 0
OCR(Optical Character Recognition,光学字符识别)
OCR(Optical Character Recognition,光学字符识别)是一种将图像中的文字转换成可编辑文本的技术。OCR 技术可以应用于各种场景,例如自动化办公、图像文本识别、车牌识别、身份证识别、发票识别等。
270 1
深度学习应用篇-计算机视觉-OCR光学字符识别[7]:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景
深度学习应用篇-计算机视觉-OCR光学字符识别[7]:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景
深度学习应用篇-计算机视觉-OCR光学字符识别[7]:OCR综述、常用CRNN识别方法、DBNet、CTPN检测方法等、评估指标、应用场景
MATLAB实现OCR识别数字和字符
OCR也叫做光学字符识别,是计算机视觉研究领域的分支之一。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等