解决pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file C:\\Program Files\\Tesseract-

本文涉及的产品
票证核验,票证核验 50次/账号
小语种识别,小语种识别 200次/月
通用文字识别,通用文字识别 200次/月
简介: pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file C:\Program Files\Tesseract-OCR\tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘chi_sim’ Tesseract couldn’t load any languages! Cou

pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file C:\Program Files\Tesseract-OCR\tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘chi_sim’ Tesseract couldn’t load any languages! Could not initialize tesseract.’)




报错信息

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file C:\\Program Files\\Tesseract-OCR\\tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'chi_sim\' Tesseract couldn\'t load any languages! Could not initialize tesseract.') 


解决办法

path="img\\text-img.png"testdata_dir_config='--tessdata-dir "C:\\ProgramFiles\\Tesseract-OCR\\tessdata"'textCode=pytesseract.image_to_string(Image.open(path), config=testdata_dir_config, lang='chi_sim') 


若不能使用,配置环境变量

Tesseract-OCRC:\ProgramFiles\Tesseract-OCR\tessdata

安装 pytesseract 模块

pipinstallpytesseract-ihttp://pypi.douban.com/simple--trusted-hostpypi.douban.com


安装Tesseract OCR

下载地址:https://github.com/UB-Mannheim/tesseract/wiki点击“tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe”下载安装。注意:安装的时候选中中文包(安装时把所有选项都勾上)。本人安装目录:C:\ProgramFiles\Tesseract-OCR\tessdata使用命令,查看版本号和支持语言:cdC:\ProgramFiles\Tesseract-OCRtesseract-vtesseract--list-langs-vtesseract--list-langs  # 查看Tesseract-OCR支持语言 

配置tesseract运行文件

...\Lib\site-packages\pytesseract\pytesseract.py找到文件:tesseract_cmd='tesseract'修改为:tesseract_cmd='C:\\Program Files\\Tesseract-OCR\\tesseract.exe'你放tesseract.exe的路径



Github地址:https://github.com/UB-Mannheim/tesseract/wiki


识别中文时,如果还是报错,可以将中文包下载到本地。


推荐阅读:

https://blog.csdn.net/weixin_41194171/article/details/110433724

https://www.cnblogs.com/sea-stream/p/11542359.html

https://blog.csdn.net/magicianofcodes/article/details/79401622

目录
相关文章
|
算法 计算机视觉
Opencv学习笔记(六):cv2.resize函数的介绍
这篇文章介绍了OpenCV库中cv2.resize函数的使用方法,包括其参数、插值方式选择以及实际代码示例。
2058 1
Opencv学习笔记(六):cv2.resize函数的介绍
|
文字识别 块存储 Python
Python 图片文字识别和 tesseract 问题解决
Python 图片文字识别和 tesseract 问题解决
1625 1
|
计算机视觉
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
这篇文章详细介绍了OpenCV库中的图像二值化函数`cv2.threshold`,包括二值化的概念、常见的阈值类型、函数的参数说明以及通过代码实例展示了如何应用该函数进行图像二值化处理,并展示了运行结果。
3549 0
Opencv学习笔记(三):图像二值化函数cv2.threshold函数详解
|
9月前
|
存储 人工智能 数据库
Agno:18.7K Star!快速构建多模态智能体的轻量级框架,运行速度比LangGraph快5000倍!
Agno 是一个用于构建多模态智能体的轻量级框架,支持文本、图像、音频和视频等多种数据模态,能够快速创建智能体并实现高效协作。
2549 22
Agno:18.7K Star!快速构建多模态智能体的轻量级框架,运行速度比LangGraph快5000倍!
|
机器学习/深度学习 编解码 监控
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
这篇文章详细介绍了如何使用YOLOv8进行目标检测任务,包括环境搭建、数据准备、模型训练、验证测试以及模型转换等完整流程。
20977 59
目标检测实战(六): 使用YOLOv8完成对图像的目标检测任务(从数据准备到训练测试部署的完整流程)
|
10月前
|
人工智能 开发者 Python
Chainlit:一个开源的异步Python框架,快速构建生产级对话式 AI 应用
Chainlit 是一个开源的异步 Python 框架,帮助开发者在几分钟内构建可扩展的对话式 AI 或代理应用,支持多种工具和服务集成。
1087 9
|
JavaScript 计算机视觉
FLUX.1 Tools 全家桶开源!文末附一键ComfyUI启动链接
Black Forest Labs 发布了 FLUX.1 Tools,一套增强 FLUX.1 文本转图像模型的工具集,包括 FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny 和 FLUX.1 Redux,分别用于图像修复、深度引导、边缘检测和图像重组。提供详细的安装指南和模型下载链接,支持用户快速上手并优化图像处理流程。
4261 4
FLUX.1 Tools 全家桶开源!文末附一键ComfyUI启动链接
|
Java UED Spring
Springboot通过SSE实现实时消息返回
通过Spring Boot实现SSE,可以简单高效地将实时消息推送给客户端。虽然SSE有其限制,但对于许多实时消息推送场景而言,它提供了一种简洁而强大的解决方案。在实际开发中,根据具体需求选择合适的技术,可以提高系统的性能和用户体验。希望本文能帮助你深入理解Spring Boot中SSE的实现和应用。
5692 1
|
存储 设计模式 Java
阿里官方代码规范
这篇文章详细介绍了阿里巴巴官方的代码规范,包括命名规则、常量使用、方法覆写、并发处理、注释规范、数据库设计等多个方面,旨在提高代码的可读性、维护性和扩展性。