文字识别OCR那种图片坐标信息我不需要，可以在请求的时候去掉吗？

展开

收起

三分钟热度的鱼 2023-07-19 18:45:40 285 版权

9 条回答

写回答

取消提交回答

wljslmz

公众号：网络技术联盟站，InfoQ签约作者，阿里云社区签约作者，华为云云享专家，BOSS直聘创作王者，腾讯课堂创作领航员，博客+论坛：https://www.wljslmz.cn，工程师导航：https://www.wljslmz.com

在阿里云文字识别OCR服务中，可以通过设置请求参数来指定您是否需要返回图片坐标信息。

在进行文字识别时，通常OCR服务会返回识别结果的文字内容以及对应的坐标信息。如果您不需要获取坐标信息，可以在请求时将相应的参数设置为false或不设置，以去除返回的坐标信息。

具体而言，在不同的OCR接口中，参数的设置方式可能会有所不同。以下是一个使用Java SDK调用文字识别OCR服务并去除坐标信息的示例：

import com.aliyun.tea.TeaException;
import com.aliyun.tea.TeaPair;
import com.aliyuncs.CommonResponse;
import com.aliyuncs.DefaultAcsClient;
import com.aliyuncs.IAcsClient;
import com.aliyuncs.exceptions.ClientException;
import com.aliyuncs.profile.DefaultProfile;
import com.aliyuncs.profile.IClientProfile;
import com.aliyuncs.ocr.model.v20191230.RecognizeQuotaInvoiceRequest;
import com.aliyuncs.ocr.model.v20191230.RecognizeQuotaInvoiceResponse;

import java.util.ArrayList;
import java.util.List;

public class OCRWithoutCoordinateExample {

    public static void main(String[] args) {
        // 阿里云Access Key ID和Access Key Secret
        String accessKeyId = "<your-access-key-id>";
        String accessKeySecret = "<your-access-key-secret>";

        try {
            // 创建DefaultProfile实例，设置区域ID
            IClientProfile clientProfile = DefaultProfile.getProfile("<your-region-id>", accessKeyId, accessKeySecret);

            // 创建IAcsClient实例
            IAcsClient client = new DefaultAcsClient(clientProfile);

            // 创建请求对象
            RecognizeQuotaInvoiceRequest request = new RecognizeQuotaInvoiceRequest();

            // 设置请求参数
            // 设置是否返回坐标信息为false，即不返回坐标信息
            request.setIsIncludeCoordinate(false);

            // 设置待识别的图片URL或内容
            request.setImageURL("<your-image-url>");

            // 发起请求，获取响应
            CommonResponse response = client.getCommonResponse(request);

            // 解析响应
            RecognizeQuotaInvoiceResponse recognizeResponse = RecognizeQuotaInvoiceResponse.unmarshall(response.getData());

            // 处理识别结果
            // ...

        } catch (ClientException | TeaException e) {
            e.printStackTrace();
            // 处理异常
            // ...
        }
    }
}

在上述示例中，通过调用 setIsIncludeCoordinate(false) 方法将返回坐标信息设置为false，从而去除返回结果中的坐标信息。

2023-08-22 22:15:16

赞同展开评论

魏红斌

天下风云出我辈，一入江湖岁月催，皇图霸业谈笑中，不胜人生一场醉。

是的，您可以在请求中去掉图片的坐标信息。具体而言，如果您想要使用OCR技术来解析图片文字，那么您可以将图片上传到OCR服务中，然后使用OCR服务提供的API来获取识别结果。在这种情况下，OCR服务通常会将识别结果返回给您，而不需要您提供图片的坐标信息。

2023-07-21 09:44:35

赞同展开评论
行十三

云端行者觅知音，技术前沿我独行。前言探索无边界，阿里风光引我情。

可以的，您可以在请求OCR服务时将坐标信息设置为None或空字符串，这样就不会返回坐标信息。具体的设置方法可以参考阿里云文字识别OCR的API文档。另外，如果您不需要坐标信息，也可以使用阿里云文字识别OCR的SDK或客户端，这样可以更方便地进行配置和使用。

2023-07-20 19:15:18

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在请求文字识别OCR时，通常可以选择是否获取图片的坐标信息。具体取决于所使用的OCR工具或服务以及其提供的API。

如果您不需要获取图片的坐标信息，可以查阅OCR工具或服务的文档，查找任何可用的参数或选项来控制返回结果中的坐标信息。

一般而言，OCR服务的API请求参数可能包括以下选项：
- with_coordinates：一个布尔值参数，用于指示是否要返回识别结果中每个字符或文本区域对应的坐标信息。将其设置为 false 或 0 可以排除坐标信息，默认情况下可能是启用的。
请注意，某些OCR工具或服务可能默认返回坐标信息，并且在请求中禁用该功能可能会导致部分返回结果被省略。确保查阅相关文档或开发者指南，了解所使用的OCR工具或服务的参数选项和行为，以便根据需要调整请求。

如果找不到相应的参数或选项来控制坐标信息，但仍然希望去除坐标信息，您可以在接收到OCR结果后，自行处理返回的数据，删除坐标信息或只保留所需的文本内容。
2023-07-20 18:35:56

赞同展开评论
六月的雨在钉钉

从事java行业9年至今，热爱技术，热爱以博文记录日常工作，csdn博主，座右铭是：让技术不再枯燥，让每一位技术人爱上技术

您好，查阅了文字识别OCR部门API文档中关于返回数据中位置坐标信息pos内容的相关描述，没有找到可以直接指定的属性来保证不返回图片的坐标信息，个人建议您可以在业务代码中调用API获取的返回参数中不处理pos信息即可，选择您需要的字段保存数据就可以了。

2023-07-20 15:20:19

赞同展开评论
牧羊吖

月移花影，暗香浮动

当使用OCR服务进行文字识别时，通常会返回识别结果中的文本内容以及每个文字的坐标信息。如果您不需要获得坐标信息，可以在请求中指定相应的参数来控制返回结果的内容。具体来说，您可以通过设置detect_direction参数为false来去掉坐标信息。

2023-07-20 09:14:46

赞同展开评论
算精通

北京阿里云ACE会长

在OCR服务中，一般会返回识别结果和对应的坐标信息，用于标识每个识别结果在原始图像中的位置。如果您不需要坐标信息，可以在OCR识别请求中设置相应的参数来去除坐标信息。

具体而言，不同OCR服务提供商可能会有不同的参数设置方式，以下是一些常见的去除坐标信息的方法：

使用OCR服务提供商提供的API：一些OCR服务提供商可能会在API中提供去除坐标信息的参数，例如tessedit_create_boxfile参数。此时，OCR服务将不会返回识别结果的坐标信息。

使用OCR库提供的API：一些OCR库可能会在API中提供去除坐标信息的选项，例如Tesseract OCR库中的OCR_LEVEL_WORD等级。此时，OCR库将不会返回识别结果的坐标信息。

2023-07-20 08:06:35

赞同展开评论
Star时光

是的，您可以在请求文字识别OCR服务时选择不返回图片坐标信息。通常，OCR服务会返回识别到的文本内容以及每个文本区域的坐标信息。

如果您只对文本内容感兴趣，并不需要详细的坐标信息，可以查看OCR服务提供商的API文档，了解如何设置参数来指示不返回坐标信息。通常，API中会提供相应的选项或标志，让您选择是否包含坐标信息。通过将该选项设置为"false"或使用相应的参数，您可以请求仅返回纯文本内容，而无需包含坐标信息。

2023-07-19 19:19:58

赞同展开评论
圆不溜秋的小猫猫

你们在对接接口的时候可以不用这部分信息。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

2023-07-19 18:57:54

赞同展开评论

滑动查看更多

文字识别OCR那种图片坐标信息我不需要，可以在请求的时候去掉吗？

文字识别

相关文章

热门讨论

热门文章