安装相关软件包:
$ pip3 install pillow ( pillow 是windows下的PIL库的精简版,使用方法同PIL一样) $ pip3 install pytesseract
下载Tesseract-OCR 引擎windows安装版:
网址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.01dev-20170510.exe
安装位置可自定义,假设为:D:\install_hezhiqiang\Tesseract-OCR
设置环境变量:
在path中添加:
D:\install_hezhiqiang\Tesseract-OCR
系统环境变量中,添加变量“ TESSDATA_PREFIX ”,变量值为“D:\install_hezhiqiang\Tesseract-OCR\tessdata ”,如下图
初步使用:
$ import pytesseract $ from PIL import Image $ img = Image.open('./tvn0.jpg') $ s = pytesseract.image_to_string(image) $ print(s)
我的微信公众号名称:深度学习与先进智能决策
微信公众号ID:MultiAgent1024
公众号介绍:主要研究强化学习、计算机视觉、深度学习、机器学习等相关内容,分享学习过程中的学习笔记和心得!期待您的关注,欢迎一起学习交流进步!