从零开始的OCR之旅

简介: 本文介绍了如何配置环境并使用EasyOCR库进行OCR任务,包括安装依赖、下载必要的模型包,并提供了一个简单的使用示例。

从零开始的OCR之旅

一、EasyOCR

Python中有一个不错的OCR库-EasyOCR
不过今天复现的时候遇到了不少问题,卡了一个早上希望下面能帮助后来者避开

二、环境配置

软件:Anaconda3,Pycharm
环境配置:
1、easyocr1.4.1
2、pytorch>=1.10
3、opencv-python5.4.1.60

三、配置过程

  1. 在Anaconda上新建一个环境EasyOcr

2. 下载easyocr包

  1. 下载pytorch包
  2. 下载opencv-python包 (一定不要最新版本或者不下,由于easyocr项目本身问题可能是开源作者还没有兼容吧,会报错的)

5、去官网手动下载model包
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft\_mlt\_25k.zip

中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese\_sim.zip
并放置在如下位置
在这里插入图片描述
在这里插入图片描述

6、添加环境后跑通代码
素材:
在这里插入图片描述

import easyocr
import cv2

reader = easyocr.Reader(['ch_sim','en'],gpu=False)

img=cv2.imread('./1.jpg')

result = reader.readtext(img)
with open('out.txt','w',encoding='utf-8')as f:
    for res in result:
        print(res)
        pos=res[0]
        text=res[1]
        cv2.rectangle(img,pos[0],pos[2],(160,0,0),3)
        f.write(text)
        f.write('\n')
cv2.imwrite('11.jpg',img)

在这里插入图片描述

二、PaddleOCR

相关文章
|
机器学习/深度学习 人工智能 文字识别
轻松识别文字,这款Python OCR库支持超过80种语言
轻松识别文字,这款Python OCR库支持超过80种语言
860 2
|
5月前
|
机器学习/深度学习 前端开发 API
python3如何使用QT编写基础的对话框程序
Qt与Python结合形成了PyQt/PySide,为桌面应用开发提供强大支持。通过简单安装PyQt5或PySide6,开发者可快速搭建跨平台GUI应用。本文从创建基础对话框入手,介绍布局管理、信号与槽机制、对话框模式及样式表美化等核心功能,并探讨模态窗口、事件驱动编程和资源打包等内容。最后,引导读者探索模型视图架构、多线程处理等进阶技术,逐步掌握用Python+Qt开发高效桌面应用的技能。
172 0
|
8月前
有偿创建 CosyVoice2-0.5B 大模型
有偿创建 CosyVoice2-0.5B 大模型,希望有人能帮忙在创空间 创建一个这样的模型,官方的老出502
493 22
|
11月前
|
数据采集 人工智能 数据可视化
InternVL 2.5,首个MMMU超过70%的开源模型,性能媲美GPT-4o
近期Internvl2.5发布,性能与GPT-4o和Claude-3.5-sonnet等领先的商业模型相媲美,成为首个在MMMU上超过70%的开源模型,通过链式思考(CoT)推理实现了3.7个百分点的提升,展示了强大的测试时间可扩展性潜力。
826 25
|
PyTorch 算法框架/工具 Python
yolov5的完整部署(适合新人和懒人,一键安装)
这篇文章为新人和希望简化部署过程的用户介绍了如何一键安装和配置YOLOv5环境,包括安装Anaconda、设置镜像源、安装PyCharm、创建虚拟环境、下载YOLOv5项目、安装依赖以及在PyCharm中配置和运行项目。
7033 0
yolov5的完整部署(适合新人和懒人,一键安装)
|
Python
Python时间戳与datetime转换指南
Python时间戳与datetime转换指南
717 0
|
文字识别 PyTorch 算法框架/工具
【Python】已解决:Python正确安装文字识别库EasyOCR
【Python】已解决:Python正确安装文字识别库EasyOCR
2634 0
|
机器学习/深度学习 并行计算 安全
ImportError: DLL load failed while importing libpaddle: 找不到指定的模块问题
【6月更文挑战第7天】ImportError: DLL load failed while importing libpaddle: 找不到指定的模块问题
3248 0
|
PyTorch 算法框架/工具
The “freeze_support()“ line can be omitted if the program is not going to be frozen
The “freeze_support()“ line can be omitted if the program is not going to be frozen
294 1
|
Java Nacos 网络架构
SpringCloud Gateway的使用 + Nacos动态路由
SpringCloud Gateway的使用 + Nacos动态路由