身处数据爆炸增长的信息时代,各种各样的数据都飞速增长,以图片的形式出现的数据更是数不胜数。有时候,我们想要提取图片中的文字,需要一个一个地敲打键盘输入。但如果你 使用python,三行代码足矣!
一、提取图片文字
1、代码及运行成果
以这张图片为例:
这样的结果是把文字识别出来后,以列表的形式展示出来。我们可以做进一步的处理,把这些形成一个段落展示出来,具体如下:
import easyocr reader = easyocr.Reader(['ch_sim', 'en']) result = reader.readtext('D:/1.png', detail=0) article = '' # 定义一个空的字符串 for i in range(len(result)): article += result[i] # 将列表中的字符串依次拼接在一起 print(article)
结果如下:
2、库的安装及一些问题的解决方案
- GitHub地址:
https://github.com/ushelp/EasyOCR
- EasyOCR 中文主页:
库的安装
pip install easyocr=
安装完库,进行代码的运行,可能出现的问题:
错误提示1:
OSError: [WinError 126] 找不到指定的模块。 Error loading “D:\Python\lib\site-packages\torch\lib\asmjit.dll” or one of its dependencies.
解决方案:
根据提示网址,下载相应的模块。
错误提示2:
网络连接超时或者连接断开
解决方案
可以直接下载字体模型,放到指定的路径中。
常见字体模型
- 模型所放路径
Windows:C:\Users\用户名\.EasyOCR\model
其实也可以偷懒,直接搜.EasyOCR
,然后点击model
,把字体模型放在这里。然后就解决问题了!
二、Blogger’s speech
如有不足,还请大佬评论区留言或私信我,我会进行补充。