文字识别OCR识别的可信度如何返回?是否可以返回识别的可信度?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
文字识别OCR在返回结果时,确实可以提供识别的可信度信息。以下是关于如何返回可信度以及相关参数的详细说明:
OCR服务在识别图片中的文字内容时,会为每个识别出的文字块、字段或单字提供置信度(Confidence)值。这些值通常以整数形式表示,范围为0到100,数值越高表示识别结果越可信。
文字块的置信度:
在通用文字识别和全文识别高精版中,prism_wordsInfo
字段会包含每个文字块的置信度信息。例如:
"prism_wordsInfo": [
{
"word": "示例文字",
"prob": 98
}
]
其中,prob
字段即为该文字块的置信度。
字段级别的置信度:
对于结构化信息(如身份证、驾驶证等),OCR会为每个字段(如姓名、身份证号等)返回单独的置信度。例如:
"KeyConfidence": 100,
"ValueConfidence": 98
这里,KeyConfidence
表示字段名称的置信度,ValueConfidence
表示字段值的置信度。
单字级别的置信度:
如果启用了高级配置(AdvancedConfig.OutputCharInfo=true
),OCR还可以返回单字级别的置信度信息。例如:
"charInfos": [
{
"CharContent": "合",
"CharConfidence": 95
}
]
其中,CharConfidence
表示单字的置信度。
OCR服务能够返回多种粒度的识别可信度信息,包括文字块、字段和单字级别。用户可以根据需求选择合适的置信度字段,并结合业务场景设置合理的阈值,以提升识别结果的准确性和可靠性。