ModelScope的pipeline有办法输出置信度吗?

"ocr_recogition Tasks的ModelScope的pipeline有办法输出置信度吗? 1f0f71ebf1c20360d2883cddeb3dc192.png
"

展开
收起
小小爱吃香菜 2024-04-23 21:02:46 88 分享 版权
阿里云 AI 助理回答

在ModelScope的OCR识别任务中,是否能够输出置信度取决于具体使用的模型和API接口。根据阿里云文字识别相关文档的说明,许多OCR接口确实支持返回识别结果的置信度信息。以下是详细解答:

1. 置信度的定义与作用

置信度(Confidence)是OCR模型对识别结果可信程度的量化指标,通常以0到1或0到100的数值表示。较高的置信度意味着模型对识别结果更有信心,而较低的置信度可能提示需要人工校验。

2. 支持置信度输出的场景

根据知识库中的文档描述,以下OCR相关接口明确支持置信度输出: - 模板服务预测API:返回字段prob表示算法结果的置信度,范围为0到1。 - 分类器服务预测API:返回字段prob同样表示算法结果的置信度,范围为0到1。 - 预置能力服务预测API:返回字段prob表示每个识别结果的置信度,范围为0到1。 - 统一识别接口(RecognizeAllText):返回字段KeyConfidenceValueConfidence分别表示字段名称和字段值的置信度,范围为0到100。 - 银行承兑汇票识别:返回字段keyProbvalueProb分别表示字段名称和字段值的置信度。 - 电子面单识别:返回字段keyProbvalueProb分别表示字段名称和字段值的置信度。

3. 如何获取置信度

要获取置信度信息,您需要确保以下几点: - 选择支持置信度输出的模型或API:并非所有OCR模型都默认返回置信度,因此需要确认所使用的模型是否支持该功能。 - 检查返回参数:在调用API时,查看返回的JSON数据中是否包含置信度相关字段(如probKeyConfidenceValueConfidence等)。 - 配置输出选项:某些接口可能需要通过特定参数启用置信度输出。例如,在RecognizeAllText接口中,可以通过设置OutputCoordinate参数来控制是否返回坐标和置信度信息。

4. 示例代码

以下是一个基于RecognizeAllText接口的示例,展示如何获取置信度信息:

{
  "RequestId": "F25FBAB4-665A-5D85-8AEF-39AE29F7D588",
  "Data": {
    "KvDetails": {
      "address": {
        "KeyName": "address",
        "KeyConfidence": 100,
        "Value": "XX省XX市XX街道",
        "ValueConfidence": 98
      }
    }
  }
}

在此示例中,KeyConfidenceValueConfidence分别表示字段名称和字段值的置信度。

5. 注意事项

  • 置信度阈值:建议根据实际应用场景设定置信度阈值,低于阈值的结果可能需要人工复核。
  • 模型差异:不同模型的置信度计算方式可能有所不同,请参考具体模型的文档说明。
  • 权限问题:部分接口可能需要特定权限才能访问置信度信息,例如RecognizeWaybill接口中提到的权限限制。

如果您正在使用ModelScope的pipeline,建议查阅对应模型的文档或联系技术支持,确认其是否支持置信度输出以及具体的实现方式。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理