python实现图片文字识别

简介: 代码有点久远了...就留作纪念了 现在网上应该很多了

环境:python3


首先需要申请获得文字识别的API,例如:百度或者讯飞科技的文字识别API


核心代码:

# coding :gbk#APP ID:xxxxx#API KEY:aaaaa#SK:sssss#执行pip install baidu-aip 安装SDKfromaipimportAipOcrimportjsonimportseleniumimportwebdriver""" APPID AK SK """APP_ID='xxxxx'API_KEY='aaaaa'SECRET_KEY='sssss'client=AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取图片 """defget_file_content(filePath):
withopen(filePath, 'rb') asfp:
returnfp.read()
image=get_file_content(r'D:\image\1.jpg')
#print(client.basicGeneral(image))textData=client.basicAccurate(image)['words_result']
text= []
print(textData)
foriinrange(0, len(textData)):
text.append(textData[i]['words'])
text="".join(text)  #"".join('%s' %id for id in text)#百度搜索:https://www.baidu.com/s?wd=link='https://www.baidu.com/s?wd='+text#headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'}driver=webdriver.Chrome()
driver.get(link)
'''""" 如果有可选参数 """options = {}options["language_type"] = "CHN_ENG"options["detect_direction"] = "true"options["detect_language"] = "true"options["probability"] = "true"""" 带参数调用通用文字识别, 图片参数为本地图片 """client.basicGeneral(image, options)url = "https//www.x.com/sample.jpg"""" 调用通用文字识别, 图片参数为远程url图片 """client.basicGeneralUrl(url);""" 如果有可选参数 """options = {}options["language_type"] = "CHN_ENG"options["detect_direction"] = "true"options["detect_language"] = "true"options["probability"] = "true"""" 带参数调用通用文字识别, 图片参数为远程url图片 """client.basicGeneralUrl(url, options)'''
目录
相关文章
|
5月前
|
机器学习/深度学习 编解码 Python
Python图片上采样工具 - RealESRGANer
Real-ESRGAN基于深度学习实现图像超分辨率放大,有效改善传统PIL缩放的模糊问题。支持多种模型版本,推荐使用魔搭社区提供的预训练模型,适用于将小图高质量放大至大图,放大倍率越低效果越佳。
432 3
|
5月前
|
机器学习/深度学习 文字识别 Java
Python实现PDF图片OCR识别:从原理到实战的全流程解析
本文详解2025年Python实现扫描PDF文本提取的四大OCR方案(Tesseract、EasyOCR、PaddleOCR、OCRmyPDF),涵盖环境配置、图像预处理、核心识别与性能优化,结合财务票据、古籍数字化等实战场景,助力高效构建自动化文档处理系统。
1471 0
|
9月前
|
数据采集 Web App开发 JavaScript
基于Selenium的Python爬虫抓取动态App图片
基于Selenium的Python爬虫抓取动态App图片
681 68
|
存储 人工智能 开发工具
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
只需要通过向AI助理提问的方式输入您的需求,即可瞬间获得核心流程代码及参数,缩短学习路径、提升开发效率。
1782 5
AI助理化繁为简,速取代码参数——使用python SDK 处理OSS存储的图片
|
7月前
|
数据采集 存储 监控
Python爬虫实战:批量下载亚马逊商品图片
Python爬虫实战:批量下载亚马逊商品图片
|
Python
Python实用记录(六):如何打开txt文档并删除指定绝对路径下图片
这篇文章介绍了如何使用Python打开txt文档,删除文档中指定路径的图片,并提供了一段示例代码来展示这一过程。
226 1
|
9月前
|
文字识别 Python
python做ocr卡证识别很简单
本示例展示了如何使用 `potencent` 库调用腾讯云 OCR 服务识别银行卡和身份证信息。代码中分别通过本地图片路径 (`img_path`) 和配置文件 (`potencent-config.toml`) 实现了银行卡和身份证的 OCR 识别,并输出结果。测试图片及结果显示了识别效果,需提前配置腾讯云的 `SECRET_ID` 和 `SECRET_KEY`。
|
9月前
|
存储 机器学习/深度学习 人工智能
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
本文探讨了多模态RAG系统的最优实现方案,通过模态特定处理与后期融合技术,在性能、准确性和复杂度间达成平衡。系统包含文档分割、内容提取、HTML转换、语义分块及向量化存储五大模块,有效保留结构和关系信息。相比传统方法,该方案显著提升了复杂查询的检索精度(+23%),并支持灵活升级。文章还介绍了查询处理机制与优势对比,为构建高效多模态RAG系统提供了实践指导。
2432 0
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
|
计算机视觉 Python
Python实用记录(一):如何将不同类型视频按关键帧提取并保存图片,实现图片裁剪功能
这篇文章介绍了如何使用Python和OpenCV库从不同格式的视频文件中按关键帧提取图片,并展示了图片裁剪的方法。
645 0
|
Python
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输
使用Python的socket库实现客户端到服务器端的图片传输,包括客户端和服务器端的代码实现,以及传输结果的展示。
836 3
Socket学习笔记(二):python通过socket实现客户端到服务器端的图片传输

热门文章

最新文章

推荐镜像

更多