我使用Pytesseract来阅读PDF的特定部分。以下是我的代码配置tesseract到我的代码。
pytesseract.pytesseract.tesseract_cmd = os.path.join(cwd, "Tesseract-OCR\\tesseract.exe")
cwd是我的SplitPDF.py文件和Tesseract-OCR(其中包含tesseract.exe)文件夹所在的目录。 当我执行SplitPDF.py时,一切工作正常,我得到了想要的输出。 但是,当我创建SplitPDF.exe(使用Pyinstaller)时,出现了一个错误,提示没有安装tesseract.exe,或者它不在您的路径中。 以下是完整的错误: 我没有正确创建。exe还是有更好的方式来配置Tesseract? 问题来源StackOverflow 地址:/questions/59378317/tesseract-exe-is-not-installed-or-its-not-in-your-path
您应该考虑使用Pytesseract库(tesseract python库)代替可执行文件。我希望这能有所帮助。用法很简单。你必须先安装它才能使用
import pytesseract
from PIL import Image
pytesseract.image_to_string(Image.open('image'))
希望这有助于
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。