从零开始的OCR之旅

简介: 本文介绍了如何配置环境并使用EasyOCR库进行OCR任务,包括安装依赖、下载必要的模型包,并提供了一个简单的使用示例。

从零开始的OCR之旅

一、EasyOCR

Python中有一个不错的OCR库-EasyOCR
不过今天复现的时候遇到了不少问题,卡了一个早上希望下面能帮助后来者避开

二、环境配置

软件:Anaconda3,Pycharm
环境配置:
1、easyocr1.4.1
2、pytorch>=1.10
3、opencv-python5.4.1.60

三、配置过程

  1. 在Anaconda上新建一个环境EasyOcr

2. 下载easyocr包

  1. 下载pytorch包
  2. 下载opencv-python包 (一定不要最新版本或者不下,由于easyocr项目本身问题可能是开源作者还没有兼容吧,会报错的)

5、去官网手动下载model包
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft\_mlt\_25k.zip

中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese\_sim.zip
并放置在如下位置
在这里插入图片描述
在这里插入图片描述

6、添加环境后跑通代码
素材:
在这里插入图片描述

import easyocr
import cv2

reader = easyocr.Reader(['ch_sim','en'],gpu=False)

img=cv2.imread('./1.jpg')

result = reader.readtext(img)
with open('out.txt','w',encoding='utf-8')as f:
    for res in result:
        print(res)
        pos=res[0]
        text=res[1]
        cv2.rectangle(img,pos[0],pos[2],(160,0,0),3)
        f.write(text)
        f.write('\n')
cv2.imwrite('11.jpg',img)

在这里插入图片描述

二、PaddleOCR

相关文章
|
5月前
|
人工智能 自然语言处理 API
手把手教你搭建微信公众号AI助手
【8月更文挑战第6天】手把手教你搭建微信公众号AI助手
308 2
手把手教你搭建微信公众号AI助手
|
2月前
|
人工智能 自然语言处理 机器人
手把手带你搭建一个语音对话机器人,5分钟定制个人AI小助手(新手入门篇)
本文介绍了如何从零开始搭建一个语音对话机器人,涵盖自动语音识别(ASR)、自然语言处理(NLP)和文本到语音合成(TTS)三大核心模块。通过使用开源工具如FunASR、LLaMA3-8B和ChatTTS,以及FastAPI和Gradio等技术,详细指导读者轻松实现个人AI小助手的构建,适合技术新手快速上手。
325 1
|
7月前
|
语音技术
【手把手教学】最新ChatTTS语音合成项目使用指南【附所有源码与模型】
【手把手教学】最新ChatTTS语音合成项目使用指南【附所有源码与模型】
|
8月前
|
算法 人工智能 缓存
CSDN官方创作助手InsCode AI 教你分分钟搞定一篇好文章
CSDN官方创作助手InsCode AI 教你分分钟搞定一篇好文章
74 0
CSDN官方创作助手InsCode AI 教你分分钟搞定一篇好文章
|
机器学习/深度学习 文字识别 监控
谈谈OCR
谈谈OCR
118 0
|
文字识别 算法 数据可视化
OCR文档自学习初体验
简要讲述什么是OCR文档自学习以及OCR文档自学习模板、信息抽取模型的使用
OCR文档自学习初体验
|
人工智能
《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(2)
《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(2)
671 0
|
人工智能 语音技术 自然语言处理
《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(1)
《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(1)
777 0
|
人工智能 Java 调度
《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(3)
《阿里云AI产品必知必会系列电子书》——智能语音交互—— 一句话识别QuickStart使用教程(3)
725 0
|
机器学习/深度学习 文字识别 自动驾驶
【OCR学习笔记】1、OCR的一般流程和发展绪论【文末获取参考论文和PPT】
【OCR学习笔记】1、OCR的一般流程和发展绪论【文末获取参考论文和PPT】
288 0