"ocr_recogition Tasks的ModelScope的pipeline有办法输出置信度吗?
"
在ModelScope的OCR识别任务中,是否能够输出置信度取决于具体使用的模型和API接口。根据阿里云文字识别相关文档的说明,许多OCR接口确实支持返回识别结果的置信度信息。以下是详细解答:
置信度(Confidence)是OCR模型对识别结果可信程度的量化指标,通常以0到1或0到100的数值表示。较高的置信度意味着模型对识别结果更有信心,而较低的置信度可能提示需要人工校验。
根据知识库中的文档描述,以下OCR相关接口明确支持置信度输出: - 模板服务预测API:返回字段prob
表示算法结果的置信度,范围为0到1。 - 分类器服务预测API:返回字段prob
同样表示算法结果的置信度,范围为0到1。 - 预置能力服务预测API:返回字段prob
表示每个识别结果的置信度,范围为0到1。 - 统一识别接口(RecognizeAllText):返回字段KeyConfidence
和ValueConfidence
分别表示字段名称和字段值的置信度,范围为0到100。 - 银行承兑汇票识别:返回字段keyProb
和valueProb
分别表示字段名称和字段值的置信度。 - 电子面单识别:返回字段keyProb
和valueProb
分别表示字段名称和字段值的置信度。
要获取置信度信息,您需要确保以下几点: - 选择支持置信度输出的模型或API:并非所有OCR模型都默认返回置信度,因此需要确认所使用的模型是否支持该功能。 - 检查返回参数:在调用API时,查看返回的JSON数据中是否包含置信度相关字段(如prob
、KeyConfidence
、ValueConfidence
等)。 - 配置输出选项:某些接口可能需要通过特定参数启用置信度输出。例如,在RecognizeAllText
接口中,可以通过设置OutputCoordinate
参数来控制是否返回坐标和置信度信息。
以下是一个基于RecognizeAllText
接口的示例,展示如何获取置信度信息:
{
"RequestId": "F25FBAB4-665A-5D85-8AEF-39AE29F7D588",
"Data": {
"KvDetails": {
"address": {
"KeyName": "address",
"KeyConfidence": 100,
"Value": "XX省XX市XX街道",
"ValueConfidence": 98
}
}
}
}
在此示例中,KeyConfidence
和ValueConfidence
分别表示字段名称和字段值的置信度。
RecognizeWaybill
接口中提到的权限限制。如果您正在使用ModelScope的pipeline,建议查阅对应模型的文档或联系技术支持,确认其是否支持置信度输出以及具体的实现方式。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352