Tesseract-OCR安装及使用

简介: Tesseract-OCR安装及使用

1、tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/


     其中带有dev的为开发版本,作者下载的版本为:tesseract-ocr-setup-3.05.01.exe


2、双击ex进行安装,同意协议并继续。



为.png

   勾选Additional language data(download)选项支持识别的语言包。


我.png


    选择安装目录


前.png


   安装完成


其.png


3、配置环境变量,在path里面添加Tesseract-OCR的安装目录。



请.png

   在CMD里面验证,是否安装成功,输入tesseract -v,出现以下信息则表示安装成功。


q1.png

4、在python里面使用tesseract。安装pytesseract。


pip install pytesseract

5、使用


from PIL import Image
import pytesseract
text = pytesseract.image_to_string(Image.open(r'test.png'))
print(text)

运行报错:pytesseract.pytesseract.TesseractError: (1,’Error opening data file /usr/local/share/tessdata/eng.traineddata’)。解决办法为添加系统变量TESSDATA_PREFIX,值为D:\Program Files (x86)\Tesseract-OCR\tessdata。然后重启以下电脑即可。

去.png

相关文章
|
2月前
|
文字识别 Java API
文字识别OCR里这些包
【2月更文挑战第7天】文字识别OCR里这些包
39 1
|
文字识别 Java C++
Tesseract-OCR的简单使用与训练
Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
5378 0
|
1月前
|
机器学习/深度学习 文字识别 并行计算
【C/C++ OCR识别】深入探索:Qt C++与OCR识别的完美结合
【C/C++ OCR识别】深入探索:Qt C++与OCR识别的完美结合
86 2
|
7月前
|
机器学习/深度学习 文字识别 算法
文本识别 (OCR)引擎之Tesseract的使用
esseract是一个开源文本识别 (OCR)引擎,用于识别图片中的文字并将其转换为可编辑的文本。
453 0
|
11月前
|
人工智能 文字识别 Linux
Tesseract OCR与文本智能识别
Tesseract OCR与文本智能识别
300 0
|
文字识别
autojs之浩然ocr-不安装插件就能用ocr
使用场景 不想安装浩然ocr插件
1450 0
|
XML 文字识别 数据格式
PDF处理、Tesseract-OCR的介绍
PDF处理、Tesseract-OCR的介绍
295 0
|
文字识别 计算机视觉 C++
文字识别OCR开源框架的对比--Tesseract vs EasyOCR ​
OCR文字识别在目前有着比较好的应用,也出现了很多的文字识别软件,但软件是面向用户的。对于我们技术人员来说,有时难免需要在计算机视觉任务中加入文字识别,如车牌号识别,票据识别等,因此软件对我们是没用的,我们需要自己实现文字识别。
文字识别OCR开源框架的对比--Tesseract vs EasyOCR  ​
|
文字识别 开发工具 git
|
文字识别 Python
Tesseract Ocr文字识别
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。
2346 0