文字识别OCR识别的可信度如何返回?是否可以返回识别的可信度?

文字识别OCR识别的可信度如何返回?是否可以返回识别的可信度?

展开
收起
真的很搞笑 2024-04-10 08:40:13 47 分享 版权
阿里云 AI 助理回答

文字识别OCR在返回结果时,确实可以提供识别的可信度信息。以下是关于如何返回可信度以及相关参数的详细说明:

1. 可信度字段的返回

OCR服务在识别图片中的文字内容时,会为每个识别出的文字块、字段或单字提供置信度(Confidence)值。这些值通常以整数形式表示,范围为0到100,数值越高表示识别结果越可信。

  • 文字块的置信度
    在通用文字识别和全文识别高精版中,prism_wordsInfo字段会包含每个文字块的置信度信息。例如:

    "prism_wordsInfo": [
    {
      "word": "示例文字",
      "prob": 98
    }
    ]
    

    其中,prob字段即为该文字块的置信度。

  • 字段级别的置信度
    对于结构化信息(如身份证、驾驶证等),OCR会为每个字段(如姓名、身份证号等)返回单独的置信度。例如:

    "KeyConfidence": 100,
    "ValueConfidence": 98
    

    这里,KeyConfidence表示字段名称的置信度,ValueConfidence表示字段值的置信度。

  • 单字级别的置信度
    如果启用了高级配置(AdvancedConfig.OutputCharInfo=true),OCR还可以返回单字级别的置信度信息。例如:

    "charInfos": [
    {
      "CharContent": "合",
      "CharConfidence": 95
    }
    ]
    

    其中,CharConfidence表示单字的置信度。

2. 可信度的应用场景

  • 低置信度过滤:用户可以根据置信度值设置阈值,过滤掉低置信度的结果,从而提高识别结果的可靠性。
  • 错误检测:对于置信度较低的字段或文字块,可以进行人工复核或重新识别。
  • 质量评估:通过分析整体置信度分布,评估图片质量和识别效果。

3. 重要提醒

  • 置信度范围:所有置信度值的范围均为0到100,建议将阈值设置为90以上以确保高精度。
  • 字段依赖性:某些字段的置信度可能受图片质量、光照条件或背景复杂度的影响,需结合实际场景使用。
  • 高级功能启用:部分高级功能(如单字级别置信度)需要在请求参数中显式启用,请参考具体API文档进行配置。

4. 总结

OCR服务能够返回多种粒度的识别可信度信息,包括文字块、字段和单字级别。用户可以根据需求选择合适的置信度字段,并结合业务场景设置合理的阈值,以提升识别结果的准确性和可靠性。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理