Python3,自动识别图片文字,这个库,我爱了。

简介: Python3,自动识别图片文字,这个库,我爱了。

1、引言


小鱼:小屌丝,你在干啥呢?

小屌丝:我女神给我的任务啊,把图片上的文字都给写下来。

小鱼:这图片上的文字,可不少啊,你都是手敲的??

小屌丝:可不,不然还有啥法子?


小鱼:我敬佩你是一条汉子。

小屌丝:鱼哥,难道你有什么好的法子?

小鱼:嗯,突然想到的, OCR 。

小屌丝:那你还不赶紧救救我,

小鱼:唉~ ~ 好吧…


图像识别,这里就要提到OCR了,

但是提到OCR,又不得不提到的两个库:


cnocr :识别图片的汉字;

Pytesseract:识别图片的英文

分别对图片的文字的中文和英文进行识别的。

话不多说,我们直接代码示例演示。


2、Cnocr


2.1 安装

老规矩,直接pip 安装


pip install cnocr

其它安装方式,直接看这两篇:


《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》

《Python3:我低调的只用一行代码,就导入Python所有库!》


提示一下,

cnocr下的torch 有161.8MB,

所以下载的话,最好在网速快或者国内镜像网站进行下载,否则就会下载失败。


image.png

2.2 代码示例

代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
  识别图片中的汉字
'''
from cnocr import CnOcr
#图片名称
file_name = './data/cn_name.png'
ocr = CnOcr()
result = ocr.ocr(file_name)
print(f"Predicted Chars:{result}")

3、Pytesseract


3.1 安装

1、pytesseract,

老规矩,直接pip 安装


pip install pytesseract

2、Tesseract

Windows版本,需要手动安装,下载地址如下:


Tesseract-OCR:https://github.com/tesseract-ocr/tesseract/wiki

下载完成后,手动添加路径到到环境变量(path)里面即可。


3.1 代码示例


代码示例


# -*- coding:utf-8 -*-
# @Time   : 2022-10-16
# @Author : Carl_DJ
'''
实现功能:
  识别图片中的英文
'''
import pytesseract
from PIL import Image
#图片名称
file_name = './data/en_name.png'
#打开图片
image = Image.open(file_name)
result = pytesseract.image_to_string(image, lang='eng')
print(f'识别结果:{result}')

4、总结


看到这里,今天的分享就到这里了。

关于识别图片中的文字,这里例举了OCR中的 cnocr 与pytesseract,

其实代码很简单,只是安装过程中需要一点点的耐心。


目录
相关文章
|
8月前
|
存储 人工智能 测试技术
如何使用LangChain的Python库结合DeepSeek进行多轮次对话?
本文介绍如何使用LangChain结合DeepSeek实现多轮对话,测开人员可借此自动生成测试用例,提升自动化测试效率。
2060 125
如何使用LangChain的Python库结合DeepSeek进行多轮次对话?
|
8月前
|
监控 数据可视化 数据挖掘
Python Rich库使用指南:打造更美观的命令行应用
Rich库是Python的终端美化利器,支持彩色文本、智能表格、动态进度条和语法高亮,大幅提升命令行应用的可视化效果与用户体验。
813 0
|
7月前
|
数据可视化 关系型数据库 MySQL
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。
782 4
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
|
7月前
|
传感器 运维 前端开发
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
本文解析异常(anomaly)与新颖性(novelty)检测的本质差异,结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法,涵盖全局、上下文与集体离群值识别,助力构建高可解释性模型。
590 10
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
|
8月前
|
机器学习/深度学习 编解码 Python
Python图片上采样工具 - RealESRGANer
Real-ESRGAN基于深度学习实现图像超分辨率放大,有效改善传统PIL缩放的模糊问题。支持多种模型版本,推荐使用魔搭社区提供的预训练模型,适用于将小图高质量放大至大图,放大倍率越低效果越佳。
680 3
|
9月前
|
运维 Linux 开发者
Linux系统中使用Python的ping3库进行网络连通性测试
以上步骤展示了如何利用 Python 的 `ping3` 库来检测网络连通性,并且提供了基本错误处理方法以确保程序能够优雅地处理各种意外情形。通过简洁明快、易读易懂、实操性强等特点使得该方法非常适合开发者或系统管理员快速集成至自动化工具链之内进行日常运维任务之需求满足。
646 18
|
8月前
|
机器学习/深度学习 文字识别 Java
Python实现PDF图片OCR识别:从原理到实战的全流程解析
本文详解2025年Python实现扫描PDF文本提取的四大OCR方案(Tesseract、EasyOCR、PaddleOCR、OCRmyPDF),涵盖环境配置、图像预处理、核心识别与性能优化,结合财务票据、古籍数字化等实战场景,助力高效构建自动化文档处理系统。
2237 0
|
9月前
|
机器学习/深度学习 API 异构计算
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。
916 0
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
|
9月前
|
存储 监控 安全
Python剪贴板监控实战:clipboard-monitor库的深度解析与扩展应用
本文介绍了基于Python的剪贴板监控技术,结合clipboard-monitor库实现高效、安全的数据追踪。内容涵盖技术选型、核心功能开发、性能优化及实战应用,适用于安全审计、自动化办公等场景,助力提升数据管理效率与安全性。
319 0

推荐镜像

更多