从零开始的OCR之旅

简介: 本文介绍了如何配置环境并使用EasyOCR库进行OCR任务,包括安装依赖、下载必要的模型包,并提供了一个简单的使用示例。

从零开始的OCR之旅

一、EasyOCR

Python中有一个不错的OCR库-EasyOCR
不过今天复现的时候遇到了不少问题,卡了一个早上希望下面能帮助后来者避开

二、环境配置

软件:Anaconda3,Pycharm
环境配置:
1、easyocr1.4.1
2、pytorch>=1.10
3、opencv-python5.4.1.60

三、配置过程

  1. 在Anaconda上新建一个环境EasyOcr

2. 下载easyocr包

  1. 下载pytorch包
  2. 下载opencv-python包 (一定不要最新版本或者不下,由于easyocr项目本身问题可能是开源作者还没有兼容吧,会报错的)

5、去官网手动下载model包
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft\_mlt\_25k.zip

中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese\_sim.zip
并放置在如下位置
在这里插入图片描述
在这里插入图片描述

6、添加环境后跑通代码
素材:
在这里插入图片描述

import easyocr
import cv2

reader = easyocr.Reader(['ch_sim','en'],gpu=False)

img=cv2.imread('./1.jpg')

result = reader.readtext(img)
with open('out.txt','w',encoding='utf-8')as f:
    for res in result:
        print(res)
        pos=res[0]
        text=res[1]
        cv2.rectangle(img,pos[0],pos[2],(160,0,0),3)
        f.write(text)
        f.write('\n')
cv2.imwrite('11.jpg',img)
AI 代码解读

在这里插入图片描述

二、PaddleOCR

目录
打赏
0
0
0
0
61
分享
相关文章
轻松识别文字,这款Python OCR库支持超过80种语言
轻松识别文字,这款Python OCR库支持超过80种语言
554 2
Kimi开源MoE架构多模态推理模型,小激活参数,大能量!
最近Moonshot AI推出了 Kimi-VL,这是一个高效的开源混合专家(MoE)视觉-语言模型(VLM),它提供了先进的多模态推理、长上下文理解以及强大的代理能力——所有这些功能都只需激活其语言解码器中的2.8B参数(Kimi-VL-A3B)。
180 1
|
4月前
有偿创建 CosyVoice2-0.5B 大模型
有偿创建 CosyVoice2-0.5B 大模型,希望有人能帮忙在创空间 创建一个这样的模型,官方的老出502
407 22
|
11月前
【qt】如何读取文件并拆分信息?
【qt】如何读取文件并拆分信息?
122 0
InternVL 2.5,首个MMMU超过70%的开源模型,性能媲美GPT-4o
近期Internvl2.5发布,性能与GPT-4o和Claude-3.5-sonnet等领先的商业模型相媲美,成为首个在MMMU上超过70%的开源模型,通过链式思考(CoT)推理实现了3.7个百分点的提升,展示了强大的测试时间可扩展性潜力。
608 25
从零开始的unity3d入门教程(一)----环境配置
该文章是《从零开始的Unity3D入门教程》系列的第一篇,详细介绍了Unity3D的环境配置过程,包括注册Unity账户、下载安装Unity Hub和Unity编辑器、配置许可证、创建Unity项目、下载安装Visual Studio 2022以及将Unity与Visual Studio相关联等步骤。
从零开始的unity3d入门教程(一)----环境配置
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等