Python3,自动识别图片文字,这个库,我爱了。

本文涉及的产品
通用文字识别,通用文字识别 200次/月
教育场景识别,教育场景识别 200次/月
个人证照识别,个人证照识别 200次/月
简介: Python3,自动识别图片文字,这个库,我爱了。

1、引言


小鱼:小屌丝,你在干啥呢?

小屌丝:我女神给我的任务啊,把图片上的文字都给写下来。

小鱼:这图片上的文字,可不少啊,你都是手敲的??

小屌丝:可不,不然还有啥法子?


小鱼:我敬佩你是一条汉子。

小屌丝:鱼哥,难道你有什么好的法子?

小鱼:嗯,突然想到的, OCR 。

小屌丝:那你还不赶紧救救我,

小鱼:唉~ ~ 好吧…


图像识别,这里就要提到OCR了,

但是提到OCR,又不得不提到的两个库:


cnocr :识别图片的汉字;

Pytesseract:识别图片的英文

分别对图片的文字的中文和英文进行识别的。

话不多说,我们直接代码示例演示。


2、Cnocr


2.1 安装

老规矩,直接pip 安装


pip install cnocr

其它安装方式,直接看这两篇:


《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》

《Python3:我低调的只用一行代码,就导入Python所有库!》


提示一下,

cnocr下的torch 有161.8MB,

所以下载的话,最好在网速快或者国内镜像网站进行下载,否则就会下载失败。


image.png

2.2 代码示例

代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
  识别图片中的汉字
'''
from cnocr import CnOcr
#图片名称
file_name = './data/cn_name.png'
ocr = CnOcr()
result = ocr.ocr(file_name)
print(f"Predicted Chars:{result}")

3、Pytesseract


3.1 安装

1、pytesseract,

老规矩,直接pip 安装


pip install pytesseract

2、Tesseract

Windows版本,需要手动安装,下载地址如下:


Tesseract-OCR:https://github.com/tesseract-ocr/tesseract/wiki

下载完成后,手动添加路径到到环境变量(path)里面即可。


3.1 代码示例


代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
  识别图片中的英文
'''
import pytesseract
from PIL import Image
#图片名称
file_name = './data/en_name.png'
#打开图片
image = Image.open(file_name)
result = pytesseract.image_to_string(image, lang='eng')
print(f'识别结果:{result}')

4、总结


看到这里,今天的分享就到这里了。

关于识别图片中的文字,这里例举了OCR中的 cnocr 与pytesseract,

其实代码很简单,只是安装过程中需要一点点的耐心。


目录
相关文章
|
5天前
|
SQL 关系型数据库 MySQL
MySQL操作利器——mysql-connector-python库详解
MySQL操作利器——mysql-connector-python库详解
26 0
|
5天前
|
机器学习/深度学习 数据处理 Python
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
从NumPy到Pandas:轻松转换Python数值库与数据处理利器
17 0
|
3天前
|
数据挖掘 Python
【Python】应用:pyproj地理计算库应用
这篇博客介绍了 `pyproj` 地理计算库的应用,涵盖地理坐标系统转换与地图投影。通过示例代码展示了如何进行经纬度与UTM坐标的互转,并利用 `pyproj.Geod` 计算两点间的距离及方位角,助力地理数据分析。 安装 `pyproj`:`pip install pyproj`。更多内容欢迎关注本博客,一起学习进步! Pancake 🍰 不迷路。😉*★,°*:.☆( ̄▽ ̄)/$:*.°★* 😏
|
4天前
|
人工智能 小程序 API
文字转语音神器+Python编程搞定语音报时小程序
文字转语音神器+Python编程搞定语音报时小程序
11 2
|
4天前
|
数据挖掘 API 数据处理
Python 数据分析及预处理常用库
Python自身数据分析功能有限,需借助第三方库增强。常用库包括NumPy、pandas、Matplotlib等。NumPy由Numeric发展而来,提供了多维数组对象及各种API,支持高效的数据处理,如数学、逻辑运算等,常作为其他高级库如pandas和Matplotlib的依赖库。其内置函数处理速度极快,建议优先使用以提升程序效率。
7 0
|
5天前
|
UED Python
Python requests库下载文件时展示进度条的实现方法
以上就是使用Python `requests`库下载文件时展示进度条的一种实现方法,它不仅简洁易懂,而且在实际应用中非常实用。
10 0
|
5天前
|
机器学习/深度学习 人工智能 数据可视化
# Python的一个非常cool的库Gradio
# Python的一个非常cool的库Gradio
17 0
|
5天前
|
监控 网络协议 数据库连接
Python3 监控端口:使用 socket 库
Python3 监控端口:使用 socket 库
15 0
|
5天前
|
数据挖掘 Python
​Python神奇之旅:探索NumPy库的力量
​Python神奇之旅:探索NumPy库的力量
12 0
|
5天前
|
Python
Python办公自动化:提取pdf文件中的图片
Python办公自动化:提取pdf文件中的图片
10 0
下一篇
无影云桌面