从零开始的OCR之旅

简介: 本文介绍了如何配置环境并使用EasyOCR库进行OCR任务,包括安装依赖、下载必要的模型包,并提供了一个简单的使用示例。

从零开始的OCR之旅

一、EasyOCR

Python中有一个不错的OCR库-EasyOCR
不过今天复现的时候遇到了不少问题,卡了一个早上希望下面能帮助后来者避开

二、环境配置

软件:Anaconda3,Pycharm
环境配置:
1、easyocr1.4.1
2、pytorch>=1.10
3、opencv-python5.4.1.60

三、配置过程

  1. 在Anaconda上新建一个环境EasyOcr

2. 下载easyocr包

  1. 下载pytorch包
  2. 下载opencv-python包 (一定不要最新版本或者不下,由于easyocr项目本身问题可能是开源作者还没有兼容吧,会报错的)

5、去官网手动下载model包
文字检测模型(CRAFT)(必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/craft\_mlt\_25k.zip

中文(简体)模型(识别中文必须)
https://pythondict.com/go/?url=https://github.com/JaidedAI/EasyOCR/releases/download/pre-v1.1.6/chinese\_sim.zip
并放置在如下位置
在这里插入图片描述
在这里插入图片描述

6、添加环境后跑通代码
素材:
在这里插入图片描述

import easyocr
import cv2

reader = easyocr.Reader(['ch_sim','en'],gpu=False)

img=cv2.imread('./1.jpg')

result = reader.readtext(img)
with open('out.txt','w',encoding='utf-8')as f:
    for res in result:
        print(res)
        pos=res[0]
        text=res[1]
        cv2.rectangle(img,pos[0],pos[2],(160,0,0),3)
        f.write(text)
        f.write('\n')
cv2.imwrite('11.jpg',img)

在这里插入图片描述

二、PaddleOCR

相关文章
|
SQL 分布式计算 Hadoop
Azkaban【基础 01】核心概念+特点+Web界面+架构+Job类型(一篇即可入门Azkaban工作流调度系统)
【2月更文挑战第6天】Azkaban【基础 01】核心概念+特点+Web界面+架构+Job类型(一篇即可入门Azkaban工作流调度系统)
1496 0
Pycharm配置镜像源(长期有效)
Pycharm配置镜像源(长期有效)
Pycharm配置镜像源(长期有效)
|
8月前
|
数据采集 Web App开发 数据可视化
Python零基础爬取东方财富网股票行情数据指南
东方财富网数据稳定、反爬宽松,适合爬虫入门。本文详解使用Python抓取股票行情数据,涵盖请求发送、HTML解析、动态加载处理、代理IP切换及数据可视化,助你快速掌握金融数据爬取技能。
7001 1
|
6月前
|
存储 文字识别 数据可视化
实用代码工具:Python打造PDF选区OCR / 截图批量处理工具(支持手动/全自动模式)
一款基于Python的PDF区域OCR与截图工具,支持精准框选、文字识别、图片截取及Excel一键导出。内置手动审核与全自动批量处理模式,结合PyMuPDF、easyocr等技术,实现高效、可视化的PDF数据提取,适用于发票、报表等场景,显著提升办公效率。
1037 11
|
9月前
|
机器学习/深度学习 文字识别 Java
Python实现PDF图片OCR识别:从原理到实战的全流程解析
本文详解2025年Python实现扫描PDF文本提取的四大OCR方案(Tesseract、EasyOCR、PaddleOCR、OCRmyPDF),涵盖环境配置、图像预处理、核心识别与性能优化,结合财务票据、古籍数字化等实战场景,助力高效构建自动化文档处理系统。
2486 0
|
机器学习/深度学习 存储 缓存
Chonkie:面向大语言模型的轻量级文本分块处理库
Chonkie是一个专为大语言模型(LLM)应用场景设计的轻量级文本分块处理库,提供高效的文本分割和管理解决方案。该库采用最小依赖设计理念,特别适用于现实世界的自然语言处理管道。本文将详细介绍Chonkie的核心功能、设计理念以及五种主要的文本分块策略。
657 0
Chonkie:面向大语言模型的轻量级文本分块处理库
|
11月前
|
JSON 文字识别 并行计算
自动识别图片点击脚本,文字识别自动点击器, 能识别屏幕内容并自动点击
本方案采用OCR文字识别+图像匹配双模式识别技术: OCR引擎识别屏幕文字内容 OpenCV模板匹配识别图形元素 PyAutoGUI实现
|
文字识别 PyTorch 算法框架/工具
【Python】已解决:Python正确安装文字识别库EasyOCR
【Python】已解决:Python正确安装文字识别库EasyOCR
3328 0
|
机器学习/深度学习 人工智能 文字识别
轻松识别文字,这款Python OCR库支持超过80种语言
轻松识别文字,这款Python OCR库支持超过80种语言
1429 2
|
小程序 Python
利用Python编程提取身份证的信息
利用Python编程提取身份证的信息
504 2