开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别OCR中,怎么分辨自己用的哪一识别?想知道在代码层面,怎么区分?

在文字识别OCR中,怎么分辨自己用的哪一识别?想知道在代码层面,怎么区分?
2eb5cb52582c0e617cf6b9c35900b092.png

展开
收起
小小鹿鹿鹿 2023-09-25 12:57:55 43 0
6 条回答
写回答
取消 提交回答
  • 在文字识别OCR中,你可以通过以下方法来分辨自己用的是哪一识别:

    1. 查看OCR服务的文档:每个OCR服务都会提供详细的文档,说明如何使用它们的服务。在这些文档中,通常会提供一些API调用的例子,你可以根据这些例子来识别自己用的是哪一识别。
    2. 查看代码中的参数:在代码中,通常会有一些参数用于指定OCR服务的类型或版本。你可以查看这些参数,来识别自己用的是哪一识别。

    以下是一个示例代码,用于调用阿里云OCR服务的识别API:

    import requests
    
    # 设置OCR服务的API接口和参数
    url = 'https://ocr-cn-shanghai.aliyuncs.com/v20170101/RecognizeText'
    params = {
        'Image': open('path/to/image', 'rb'),
        'LanguageType': 'CHN_ENG',
        'ContentType': 'image/jpeg'
    }
    
    # 发送API请求,并获取识别结果
    response = requests.post(url, params=params)
    result = response.json()
    
    # 输出识别结果
    print(result)
    

    在这个示例代码中,LanguageType参数用于指定识别的语言类型,ContentType参数用于指定图像的类型。你可以根据这些参数,来识别自己用的是哪一识别。

    2023-09-29 10:13:39
    赞同 展开评论 打赏
  • 从事java行业9年至今,热爱技术,热爱以博文记录日常工作,csdn博主,座右铭是:让技术不再枯燥,让每一位技术人爱上技术

    您好,文字识别OCR可以通过代码来看出来具体调用的是哪一个业务场景哪一个文字识别的,比如通用文字识别场景下的全文识别高精版
    image.png
    再看示例代码
    image.png
    这样就知道具体调用的是哪一种识别场景了,

    2023-09-26 14:32:15
    赞同 展开评论 打赏
  • 十分耕耘,一定会有一分收获!

    楼主你好,在阿里云文字识别OCR中,可以通过“任务ID”来区分自己使用的哪一次识别。每次提交OCR识别请求时,会返回一个任务ID,通过任务ID可以查询识别结果和识别状态。在代码层面,可以通过保存任务ID的方式,在后续的查询中使用该ID来获取对应的识别结果和状态。

    例如,以下是通过阿里云Python SDK提交OCR识别请求的代码示例:

    from aliyunsdkcore.client import AcsClient
    from aliyunsdkocr.request.v20191230 import RecognizeBusinessCardRequest
    
    client = AcsClient(region_id='your-region-id', access_key_id='your-access-key-id', access_key_secret='your-access-key-secret')
    
    request = RecognizeBusinessCardRequest.RecognizeBusinessCardRequest()
    request.set_ImageURL('your-image-url')
    request.set_Side('face')
    
    response = client.do_action_with_exception(request)
    print(str(response, encoding='utf-8'))
    

    在上述代码中,response即为OCR识别的原始结果,其中包含了任务ID。可以通过以下代码获取任务ID:

    import json
    
    result = json.loads(str(response, encoding='utf-8'))
    task_id = result.get('RequestId')
    

    获取到任务ID后,可以在后续的查询中使用该ID来获取OCR识别结果和状态。

    2023-09-26 08:42:43
    赞同 展开评论 打赏
  • 每个API名字不同

    image.png

    image.png

    2023-09-25 20:13:48
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看

    在文字识别OCR中,可以通过在代码层面进行区分的方式,例如使用不同的服务端点(Endpoint)或者调用不同的接口来区分不同的识别功能。以下是一些常见的区分方法:
    image.png

    1. 使用不同的服务接口:阿里云文字识别OCR提供了多个接口,如通用文字识别、身份证识别、银行卡识别等。根据你的需求,选择相应的接口进行调用,并传入对应的参数。
      image.png

    2. 使用不同的API请求:每个文字识别接口都有不同的API请求,例如使用ocr_general_basic接口进行通用文字识别时,请求的URL为https://ocrapi.aliyuncs.com/,而使用其他接口时可能有不同的URL。通过区分不同的API请求,你可以确定所使用的是哪一种识别类型。

    3. 设置不同的Endpoint:阿里云的不同功能和服务通常有对应的Endpoint。通过设置不同的Endpoint,可以区分不同的OCR识别功能。例如,设置通用文字识别的Endpoint为ocr.cn-shanghai.aliyuncs.com,而设置身份证识别的Endpoint为ocr.cn-beijing.aliyuncs.com

    需要注意的是,具体的区分方式取决于你所使用的OCR SDK或API库的实现。仔细查看相关文档和示例代码,可以找到更具体的区分方法和指导。

    2023-09-25 13:06:49
    赞同 展开评论 打赏
滑动查看更多

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载