python实现图片文字识别

本文涉及的产品
自定义KV模板,自定义KV模板 500次/账号
票据凭证识别,票据凭证识别 200次/月
企业资质识别,企业资质识别 200次/月
简介: 代码有点久远了...就留作纪念了 现在网上应该很多了

环境:python3


首先需要申请获得文字识别的API,例如:百度或者讯飞科技的文字识别API


核心代码:

# coding :gbk#APP ID:xxxxx#API KEY:aaaaa#SK:sssss#执行pip install baidu-aip 安装SDKfromaipimportAipOcrimportjsonimportseleniumimportwebdriver""" APPID AK SK """APP_ID='xxxxx'API_KEY='aaaaa'SECRET_KEY='sssss'client=AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取图片 """defget_file_content(filePath):
withopen(filePath, 'rb') asfp:
returnfp.read()
image=get_file_content(r'D:\image\1.jpg')
#print(client.basicGeneral(image))textData=client.basicAccurate(image)['words_result']
text= []
print(textData)
foriinrange(0, len(textData)):
text.append(textData[i]['words'])
text="".join(text)  #"".join('%s' %id for id in text)#百度搜索:https://www.baidu.com/s?wd=link='https://www.baidu.com/s?wd='+text#headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'}driver=webdriver.Chrome()
driver.get(link)
'''""" 如果有可选参数 """options = {}options["language_type"] = "CHN_ENG"options["detect_direction"] = "true"options["detect_language"] = "true"options["probability"] = "true"""" 带参数调用通用文字识别, 图片参数为本地图片 """client.basicGeneral(image, options)url = "https//www.x.com/sample.jpg"""" 调用通用文字识别, 图片参数为远程url图片 """client.basicGeneralUrl(url);""" 如果有可选参数 """options = {}options["language_type"] = "CHN_ENG"options["detect_direction"] = "true"options["detect_language"] = "true"options["probability"] = "true"""" 带参数调用通用文字识别, 图片参数为远程url图片 """client.basicGeneralUrl(url, options)'''
目录
相关文章
|
3月前
|
存储 人工智能 开发工具
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
只需要通过向AI助理提问的方式输入您的需求,即可瞬间获得核心流程代码及参数,缩短学习路径、提升开发效率。
1459 4
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
|
3月前
|
Python
Python实用记录(六):如何打开txt文档并删除指定绝对路径下图片
这篇文章介绍了如何使用Python打开txt文档,删除文档中指定路径的图片,并提供了一段示例代码来展示这一过程。
37 1
|
3月前
|
计算机视觉 Python
Python实用记录(一):如何将不同类型视频按关键帧提取并保存图片,实现图片裁剪功能
这篇文章介绍了如何使用Python和OpenCV库从不同格式的视频文件中按关键帧提取图片,并展示了图片裁剪的方法。
102 0
|
5月前
|
计算机视觉 Windows Python
windows下使用python + opencv读取含有中文路径的图片 和 把图片数据保存到含有中文的路径下
在Windows系统中,直接使用`cv2.imread()`和`cv2.imwrite()`处理含中文路径的图像文件时会遇到问题。读取时会返回空数据,保存时则无法正确保存至目标目录。为解决这些问题,可以使用`cv2.imdecode()`结合`np.fromfile()`来读取图像,并使用`cv2.imencode()`结合`tofile()`方法来保存图像至含中文的路径。这种方法有效避免了路径编码问题,确保图像处理流程顺畅进行。
450 1
|
3月前
|
Python
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输
使用Python的socket库实现客户端到服务器端的图片传输,包括客户端和服务器端的代码实现,以及传输结果的展示。
180 3
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输
|
3月前
|
Python
Python实用记录(四):os模块-去后缀或者改后缀/指定目录下图片或者子目录图片写入txt/csv
本文介绍了如何使用Python的os模块来操作文件,包括更改文件后缀、分割文件路径和后缀、将指定目录下的所有图片写入txt文档,以及将指定目录下所有子目录中的图片写入csv文档,并为每个子目录分配一个标签。
31 1
|
2月前
|
文字识别 自然语言处理 API
Python中的文字识别利器:pytesseract库
`pytesseract` 是一个基于 Google Tesseract-OCR 引擎的 Python 库,能够从图像中提取文字,支持多种语言,易于使用且兼容性强。本文介绍了 `pytesseract` 的安装、基本功能、高级特性和实际应用场景,帮助读者快速掌握 OCR 技术。
139 0
|
3月前
|
编解码 UED Python
Python批量修改指定目录下图片的大小名文章
Python批量修改指定目录下图片的大小名文章
22 1
|
3月前
|
iOS开发 MacOS Python
Python编程小案例—利用flask查询本机IP归属并输出网页图片
Python编程小案例—利用flask查询本机IP归属并输出网页图片
31 1
|
3月前
|
数据采集 自然语言处理 Python
用 Python 生成并识别图片验证码
用 Python 生成并识别图片验证码
67 1