开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR那种图片坐标信息我不需要,可以在请求的时候去掉吗?

文字识别OCR那种图片坐标信息我不需要,可以在请求的时候去掉吗?

展开
收起
三分钟热度的鱼 2023-07-19 18:45:40 91 0
9 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    在阿里云文字识别OCR服务中,可以通过设置请求参数来指定您是否需要返回图片坐标信息。

    在进行文字识别时,通常OCR服务会返回识别结果的文字内容以及对应的坐标信息。如果您不需要获取坐标信息,可以在请求时将相应的参数设置为false或不设置,以去除返回的坐标信息。

    具体而言,在不同的OCR接口中,参数的设置方式可能会有所不同。以下是一个使用Java SDK调用文字识别OCR服务并去除坐标信息的示例:

    import com.aliyun.tea.TeaException;
    import com.aliyun.tea.TeaPair;
    import com.aliyuncs.CommonResponse;
    import com.aliyuncs.DefaultAcsClient;
    import com.aliyuncs.IAcsClient;
    import com.aliyuncs.exceptions.ClientException;
    import com.aliyuncs.profile.DefaultProfile;
    import com.aliyuncs.profile.IClientProfile;
    import com.aliyuncs.ocr.model.v20191230.RecognizeQuotaInvoiceRequest;
    import com.aliyuncs.ocr.model.v20191230.RecognizeQuotaInvoiceResponse;
    
    import java.util.ArrayList;
    import java.util.List;
    
    public class OCRWithoutCoordinateExample {
    
        public static void main(String[] args) {
            // 阿里云Access Key ID和Access Key Secret
            String accessKeyId = "<your-access-key-id>";
            String accessKeySecret = "<your-access-key-secret>";
    
            try {
                // 创建DefaultProfile实例,设置区域ID
                IClientProfile clientProfile = DefaultProfile.getProfile("<your-region-id>", accessKeyId, accessKeySecret);
    
                // 创建IAcsClient实例
                IAcsClient client = new DefaultAcsClient(clientProfile);
    
                // 创建请求对象
                RecognizeQuotaInvoiceRequest request = new RecognizeQuotaInvoiceRequest();
    
                // 设置请求参数
                // 设置是否返回坐标信息为false,即不返回坐标信息
                request.setIsIncludeCoordinate(false);
    
                // 设置待识别的图片URL或内容
                request.setImageURL("<your-image-url>");
    
                // 发起请求,获取响应
                CommonResponse response = client.getCommonResponse(request);
    
                // 解析响应
                RecognizeQuotaInvoiceResponse recognizeResponse = RecognizeQuotaInvoiceResponse.unmarshall(response.getData());
    
                // 处理识别结果
                // ...
    
            } catch (ClientException | TeaException e) {
                e.printStackTrace();
                // 处理异常
                // ...
            }
        }
    }
    

    在上述示例中,通过调用 setIsIncludeCoordinate(false) 方法将返回坐标信息设置为false,从而去除返回结果中的坐标信息。

    2023-08-22 22:15:16
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    是的,您可以在请求中去掉图片的坐标信息。具体而言,如果您想要使用OCR技术来解析图片文字,那么您可以将图片上传到OCR服务中,然后使用OCR服务提供的API来获取识别结果。在这种情况下,OCR服务通常会将识别结果返回给您,而不需要您提供图片的坐标信息。

    2023-07-21 09:44:35
    赞同 展开评论 打赏
  • 云端行者觅知音, 技术前沿我独行。 前言探索无边界, 阿里风光引我情。

    可以的,您可以在请求OCR服务时将坐标信息设置为None或空字符串,这样就不会返回坐标信息。具体的设置方法可以参考阿里云文字识别OCR的API文档。另外,如果您不需要坐标信息,也可以使用阿里云文字识别OCR的SDK或客户端,这样可以更方便地进行配置和使用。

    2023-07-20 19:15:18
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在请求文字识别OCR时,通常可以选择是否获取图片的坐标信息。具体取决于所使用的OCR工具或服务以及其提供的API。

    如果您不需要获取图片的坐标信息,可以查阅OCR工具或服务的文档,查找任何可用的参数或选项来控制返回结果中的坐标信息。

    一般而言,OCR服务的API请求参数可能包括以下选项:

    • with_coordinates:一个布尔值参数,用于指示是否要返回识别结果中每个字符或文本区域对应的坐标信息。将其设置为 false0 可以排除坐标信息,默认情况下可能是启用的。

    请注意,某些OCR工具或服务可能默认返回坐标信息,并且在请求中禁用该功能可能会导致部分返回结果被省略。确保查阅相关文档或开发者指南,了解所使用的OCR工具或服务的参数选项和行为,以便根据需要调整请求。

    如果找不到相应的参数或选项来控制坐标信息,但仍然希望去除坐标信息,您可以在接收到OCR结果后,自行处理返回的数据,删除坐标信息或只保留所需的文本内容。

    2023-07-20 18:35:56
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,查阅了文字识别OCR部门API文档中关于返回数据中位置坐标信息pos内容的相关描述,没有找到可以直接指定的属性来保证不返回图片的坐标信息,个人建议您可以在业务代码中调用API获取的返回参数中不处理pos信息即可,选择您需要的字段保存数据就可以了。

    2023-07-20 15:20:19
    赞同 展开评论 打赏
  • 月移花影,暗香浮动

    当使用OCR服务进行文字识别时,通常会返回识别结果中的文本内容以及每个文字的坐标信息。如果您不需要获得坐标信息,可以在请求中指定相应的参数来控制返回结果的内容。具体来说,您可以通过设置detect_direction参数为false来去掉坐标信息。

    2023-07-20 09:14:46
    赞同 展开评论 打赏
  • 北京阿里云ACE会长

    在OCR服务中,一般会返回识别结果和对应的坐标信息,用于标识每个识别结果在原始图像中的位置。如果您不需要坐标信息,可以在OCR识别请求中设置相应的参数来去除坐标信息。

    具体而言,不同OCR服务提供商可能会有不同的参数设置方式,以下是一些常见的去除坐标信息的方法:

    使用OCR服务提供商提供的API:一些OCR服务提供商可能会在API中提供去除坐标信息的参数,例如tessedit_create_boxfile参数。此时,OCR服务将不会返回识别结果的坐标信息。

    使用OCR库提供的API:一些OCR库可能会在API中提供去除坐标信息的选项,例如Tesseract OCR库中的OCR_LEVEL_WORD等级。此时,OCR库将不会返回识别结果的坐标信息。

    2023-07-20 08:06:35
    赞同 展开评论 打赏
  • 是的,您可以在请求文字识别OCR服务时选择不返回图片坐标信息。通常,OCR服务会返回识别到的文本内容以及每个文本区域的坐标信息。

    如果您只对文本内容感兴趣,并不需要详细的坐标信息,可以查看OCR服务提供商的API文档,了解如何设置参数来指示不返回坐标信息。通常,API中会提供相应的选项或标志,让您选择是否包含坐标信息。通过将该选项设置为"false"或使用相应的参数,您可以请求仅返回纯文本内容,而无需包含坐标信息。

    2023-07-19 19:19:58
    赞同 展开评论 打赏
  • 你们在对接接口的时候可以不用这部分信息。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

    2023-07-19 18:57:54
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载