Python3,自动识别图片文字,这个库,我爱了。

本文涉及的产品
教育场景识别,教育场景识别 200次/月
企业资质识别,企业资质识别 200次/月
车辆物流识别,车辆物流识别 200次/月
简介: Python3,自动识别图片文字,这个库,我爱了。

1、引言


小鱼:小屌丝,你在干啥呢?

小屌丝:我女神给我的任务啊,把图片上的文字都给写下来。

小鱼:这图片上的文字,可不少啊,你都是手敲的??

小屌丝:可不,不然还有啥法子?


小鱼:我敬佩你是一条汉子。

小屌丝:鱼哥,难道你有什么好的法子?

小鱼:嗯,突然想到的, OCR 。

小屌丝:那你还不赶紧救救我,

小鱼:唉~ ~ 好吧…


图像识别,这里就要提到OCR了,

但是提到OCR,又不得不提到的两个库:


cnocr :识别图片的汉字;

Pytesseract:识别图片的英文

分别对图片的文字的中文和英文进行识别的。

话不多说,我们直接代码示例演示。


2、Cnocr


2.1 安装

老规矩,直接pip 安装


pip install cnocr

其它安装方式,直接看这两篇:


《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》

《Python3:我低调的只用一行代码,就导入Python所有库!》


提示一下,

cnocr下的torch 有161.8MB,

所以下载的话,最好在网速快或者国内镜像网站进行下载,否则就会下载失败。


image.png

2.2 代码示例

代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
  识别图片中的汉字
'''
from cnocr import CnOcr
#图片名称
file_name = './data/cn_name.png'
ocr = CnOcr()
result = ocr.ocr(file_name)
print(f"Predicted Chars:{result}")

3、Pytesseract


3.1 安装

1、pytesseract,

老规矩,直接pip 安装


pip install pytesseract

2、Tesseract

Windows版本,需要手动安装,下载地址如下:


Tesseract-OCR:https://github.com/tesseract-ocr/tesseract/wiki

下载完成后,手动添加路径到到环境变量(path)里面即可。


3.1 代码示例


代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
  识别图片中的英文
'''
import pytesseract
from PIL import Image
#图片名称
file_name = './data/en_name.png'
#打开图片
image = Image.open(file_name)
result = pytesseract.image_to_string(image, lang='eng')
print(f'识别结果:{result}')

4、总结


看到这里,今天的分享就到这里了。

关于识别图片中的文字,这里例举了OCR中的 cnocr 与pytesseract,

其实代码很简单,只是安装过程中需要一点点的耐心。


目录
相关文章
|
8天前
|
XML JSON 数据库
Python的标准库
Python的标准库
121 77
|
23天前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
70 4
数据分析的 10 个最佳 Python 库
|
9天前
|
XML JSON 数据库
Python的标准库
Python的标准库
38 11
|
22天前
|
人工智能 API 开发工具
aisuite:吴恩达发布开源Python库,一个接口调用多个大模型
吴恩达发布的开源Python库aisuite,提供了一个统一的接口来调用多个大型语言模型(LLM)服务。支持包括OpenAI、Anthropic、Azure等在内的11个模型平台,简化了多模型管理和测试的工作,促进了人工智能技术的应用和发展。
88 1
aisuite:吴恩达发布开源Python库,一个接口调用多个大模型
|
9天前
|
数据可视化 Python
以下是一些常用的图表类型及其Python代码示例,使用Matplotlib和Seaborn库。
通过这些思维导图和分析说明表,您可以更直观地理解和选择适合的数据可视化图表类型,帮助更有效地展示和分析数据。
48 8
|
1月前
|
XML 存储 数据库
Python中的xmltodict库
xmltodict是Python中用于处理XML数据的强大库,可将XML数据与Python字典相互转换,适用于Web服务、配置文件读取及数据转换等场景。通过`parse`和`unparse`函数,轻松实现XML与字典间的转换,支持复杂结构和属性处理,并能有效管理错误。此外,还提供了实战案例,展示如何从XML配置文件中读取数据库连接信息并使用。
Python中的xmltodict库
|
1月前
|
存储 人工智能 搜索推荐
Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库
Memoripy 是一个 Python 库,用于管理 AI 应用中的上下文感知记忆,支持短期和长期存储,兼容 OpenAI 和 Ollama API。
91 6
Memoripy:支持 AI 应用上下文感知的记忆管理 Python 库
|
17天前
|
安全 API 文件存储
Yagmail邮件发送库:如何用Python实现自动化邮件营销?
本文详细介绍了如何使用Yagmail库实现自动化邮件营销。Yagmail是一个简洁强大的Python库,能简化邮件发送流程,支持文本、HTML邮件及附件发送,适用于数字营销场景。文章涵盖了Yagmail的基本使用、高级功能、案例分析及最佳实践,帮助读者轻松上手。
28 4
|
1月前
|
数据采集 数据可视化 数据处理
Python数据科学:Pandas库入门与实践
Python数据科学:Pandas库入门与实践
|
25天前
|
测试技术 Python
Python中的异步编程与`asyncio`库
Python中的异步编程与`asyncio`库