Python 技术篇-3行代码搞定图像文字识别,pytesseract库实现

简介: Python 技术篇-3行代码搞定图像文字识别,pytesseract库实现

         

我们需要 pillowpytesseract 这两个库,pip install 安装就好。

还需要安装 Tesseract-OCR.exe 然后配置下就好了。

具体的环境配置方法请看

python 技术篇-使用pytesseract库进行图像识别之环境配置

英文字母图像识别演示

这个是我保存名为 English.png 的图片,下面我来提取文字。

image.png

pytesseract 库的 image_to_string() 方法就能把图片中的英文字母提取出来。

from PIL import Image
import pytesseract
image = Image.open('English.png')
content = pytesseract.image_to_string(image)   # 解析图片
print(content)

运行效果图

:有些字体可能会识别出现问题,尽量用比较标准的字体。

image.png

中文汉字图像识别演示

这个是我保存名为 chinese.png 的图片,下面我来提取文字。

image.png

首先需要安装对应的语言包:

Tesseract各个版本语言包获取方式和安装方法

要在 pytesseract 库的 image_to_string() 方法里加个参数 lang='chi_sim',这个就是引用对应的中文语言包,中文语言包的全名是 chi_sim.traineddata

from PIL import Image
import pytesseract
image = Image.open('English.png')
content = pytesseract.image_to_string(image, lang='chi_sim')   # 解析图片
print(content)

运行效果图

:有些字体可能会识别出现问题,尽量用比较标准的字体。

image.png

有什么问题可以评论区留言!

喜欢的点个赞❤吧!


目录
相关文章
|
4天前
|
监控 Python
Python中的装饰器:提升代码灵活性与可读性
在Python编程中,装饰器是一种强大的工具,能够提升代码的灵活性和可读性。本文将介绍装饰器的基本概念、使用方法以及实际应用场景,帮助读者更好地理解和利用这一功能。
|
7天前
|
人工智能 数据可视化 数据挖掘
【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】
【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】
|
8天前
|
存储 缓存 JavaScript
python实战篇:利用request库打造自己的翻译接口
python实战篇:利用request库打造自己的翻译接口
24 1
python实战篇:利用request库打造自己的翻译接口
|
12天前
|
数据采集 JSON 数据可视化
【python】python懂车帝数据可视化(代码+报告)
【python】python懂车帝数据可视化(代码+报告)
|
18天前
|
Web App开发 Python
在ModelScope中,你可以使用Python的浏览器自动化库
在ModelScope中,你可以使用Python的浏览器自动化库
15 2
|
11天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
5天前
|
缓存 监控 算法
优化Python代码性能的10个技巧
提高Python代码性能是每个开发者都需要关注的重要问题。本文将介绍10个实用的技巧,帮助你优化Python代码,提升程序的运行效率和性能表现。无论是避免内存泄漏、减少函数调用次数,还是使用适当的数据结构,都能在不同场景下发挥作用,使你的Python应用更加高效稳定。
|
1天前
|
缓存 开发者 Python
深入探讨Python中的装饰器:提升代码可读性与灵活性
在Python编程中,装饰器是一种强大的工具,可以在不修改原始函数代码的情况下,对其行为进行扩展或修改。本文将深入探讨装饰器的原理和用法,以及如何利用装饰器提升代码的可读性和灵活性,为Python开发者提供更加优雅和高效的编程方式。
|
2天前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
7天前
|
机器学习/深度学习 数据可视化 算法
【python】Python大豆特征数据分析 [机器学习版一](代码+论文)【独一无二】
【python】Python大豆特征数据分析 [机器学习版一](代码+论文)【独一无二】