文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？

展开

收起

青城山下庄文杰 2023-08-20 16:36:00 1042 版权

8 条回答

写回答

取消提交回答

三掌柜666

十分耕耘，一定会有一分收获！
楼主你好，是的，阿里云文字识别OCR服务中提供了“文字识别（含位置信息版）”API，该API可以实现在图片中识别指定关键字的位置信息，返回关键字在图片中的坐标。您可以使用以下步骤开始：
1. 登录阿里云控制台，进入OCR服务页面
2. 创建一个OCR应用
3. 获取AccessKey和SecretKey
4. 调用“文字识别（含位置信息版）”API进行图片识别
具体实现方法请参考阿里云OCR服务相关文档。
2023-08-22 01:02:03

赞同展开评论
Star时光
是的，阿里云提供了OCR（文字识别）服务，并且支持获取图片上指定关键字的坐标。阿里云的OCR API称为"文字识别（OCR）"服务，具体包括以下几个接口：
1. 通用文字识别（General Recognize）：可识别图像中的常见文本，返回检测到的文字内容以及对应的位置坐标。
2. 身份证识别（ID Card Recognize）：专门用于识别身份证上的文本信息，如姓名、性别、民族、出生日期等。
3. 银行卡识别（Bank Card Recognize）：用于识别银行卡上的信息，如卡号、发卡行名称等。
4. 驾驶证识别（Driver's License Recognize）：用于识别驾驶证上的文本信息，如姓名、驾驶证号码、有效期限等。
5. 营业执照识别（Business License Recognize）：用于识别营业执照上的信息，如注册号、公司名称、法人代表等。
2023-08-21 20:10:14

赞同展开评论
魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

本文主要介绍文字识别收费能力的计费方式及报价。其余未收费能力当前还处于公测阶段，可免费使用。

咨询服务
如果您有任何购买问题需要咨询阿里云视觉智能开放平台，欢迎各位企业用户、开发商、服务商或者开发者通过钉钉搜索群号23109592，加入阿里云视觉智能开放平台咨询群，与平台取得联系。

车牌识别
车牌识别能力支持按量付费和单类目预付费资源包方式进行计费。

2023-08-21 17:36:53

赞同展开评论
六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，文字识别OCR根据不同的场景提供了不同的文字识别服务，比如身份证识别、银行卡识别等，根据您上传的身份证图片或者银行卡图片准确识别出图片中的文本内容。但是文字识别OCR目前还不支持手动指定识别图中关键字的坐标位置。

2023-08-21 13:52:22

赞同展开评论
认真学习的heart
可以使用阿里云的OCR服务中的“通用文字识别”功能来实现这一目标。您可以上传一张包含文字的图片，然后在识别结果中找到指定的关键字，并获取其在图片中的坐标信息。

以下是一般步骤的概述：
1. 创建阿里云账号并开通OCR服务： 如果您还没有阿里云账号，您需要首先注册一个账号，并在控制台中开通OCR服务。
2. 获取API访问凭证： 在阿里云控制台中，您需要获取API访问凭证，通常是Access Key ID和Access Key Secret。
3. 调用OCR API： 使用API访问凭证，您可以通过调用OCR API来上传图片并获取识别结果。在识别结果中，您可以找到关键字的位置信息，通常以坐标、边界框等形式表示。
2023-08-21 13:10:20

赞同展开评论
玥轩

是的，有一些OCR API可以支持获取图片上指定关键字的坐标。例如，Tesseract OCR是一个开源的OCR引擎，支持多种语言，包括中文。您可以使用pytesseract库将其集成到Python中，然后使用它的image_to_data函数来获取图片上指定关键字的坐标。

2023-08-21 08:27:40

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
是的，阿里云提供了OCR（文字识别）服务，可以用于获取图片上指定关键字的坐标。阿里云的OCR服务名为"文档识别（OCR）"，您可以使用其API来实现该功能。

阿里云的文档识别（OCR）服务提供了多种功能，包括通用文字识别、身份证识别、驾驶证识别、银行卡识别等。通过调用相应的接口，您可以将图片上传到阿里云服务器，并从返回结果中提取包含关键字的文字位置信息。

您可以参考阿里云官方文档中的"文档识别（OCR）"部分，查看可用的API及其使用方法。具体来说，您可能会使用到的服务包括：
- 身份证识别（IdCardOCR）：用于识别身份证图片，并返回身份证正反面的文字内容和位置信息。
- 通用文字识别（OCR）：用于识别通用场景下的文本，返回图片中文字内容和位置信息。
- 表格文字识别（TableOCR）：用于识别表格中的文字，包括表头和表格内容，并返回文字的位置和结构化输出。
2023-08-20 21:06:23

赞同展开评论
wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com
是的，阿里云提供了文字识别（OCR）服务，并且支持获取图片上指定关键字的坐标。您可以使用阿里云的文本识别（OCR）API来实现此功能。

阿里云的文本识别（OCR）服务包含了多种功能，可以识别图片中的文字、身份证、银行卡等信息，并提供了相应的API接口供开发者调用。

下面是使用阿里云的文本识别（OCR）服务获取图片上指定关键字坐标的一般步骤：
1. 注册/登录阿里云账号：如果您还没有阿里云账号，请先注册一个账号并登录。
2. 开通文字识别（OCR）服务：在阿里云控制台中选择并开通文字识别（OCR）服务。
3. 获取API密钥：在阿里云控制台中创建并获取您的API密钥（Access Key ID和Access Key Secret），以便进行API调用。
4. 调用API接口：使用您的API密钥，通过调用阿里云的OCR API接口进行请求，具体可以参考阿里云提供的文档或SDK示例代码。在调用接口时，您需要将待识别的图片上传并传递给接口，同时指定要识别的关键字。
- 参考文档：RecognizeAdvanced - 全文识别高精版
1. 解析API响应：获取API的响应结果，在响应结果中会包含关键字的坐标信息，您可以从中提取出需要的信息。
2023-08-20 16:46:06

赞同展开评论

滑动查看更多

文字识别OCR过获取图片上指定关键字的坐标，有支持的API吗？

文字识别

相关文章

热门讨论

热门文章