当我们想使用 pytesseract库的时候,我们开心的使用 pip install pytesseract安装完成后,却发现它并不能识别出图片内容,并且会抛出异常: pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your PATH. See README file for more information.
我在网上找了一些资料,发现是缺少了一个重要的程序:tesseract
pytesseract官方文档:
https://pypi.org/project/pytesseract/
tesseract官方Github地址:
https://github.com/UB-Mannheim/tesseract
如果担心下载慢的话,也可以使用百度云下载(用免费给的60s提速够用了)
百度云盘链接:
https://pan.baidu.com/s/1LBFHZQfgN9svWEXyB7todA
提取码:pgju
1、安装步骤
安装到这里,有条件的小伙伴可以全部勾选(不勾选也没事,文字包可以自己安装)如果不装,默认只能识别英文。
2、手动导包(以中文包为例)
先下载中文包,可以去上面所给的github下载,也可以使用下面百度网盘下载
- 链接:
https://pan.baidu.com/s/1wACfg8pCCZN_PRJtScv99g
提取码:thl7
下载后,
即完成导入。