ModelScope的pipeline有办法输出置信度吗？

"ocr_recogition Tasks的ModelScope的pipeline有办法输出置信度吗？
"

展开

收起

小小爱吃香菜 2024-04-23 21:02:46 277 版权

阿里云 AI 助理回答

在ModelScope的OCR识别任务中，是否能够输出置信度取决于具体使用的模型和API接口。根据阿里云文字识别相关文档的说明，许多OCR接口确实支持返回识别结果的置信度信息。以下是详细解答：

1. 置信度的定义与作用

置信度（Confidence）是OCR模型对识别结果可信程度的量化指标，通常以0到1或0到100的数值表示。较高的置信度意味着模型对识别结果更有信心，而较低的置信度可能提示需要人工校验。

2. 支持置信度输出的场景

根据知识库中的文档描述，以下OCR相关接口明确支持置信度输出： - 模板服务预测API：返回字段prob表示算法结果的置信度，范围为0到1。 - 分类器服务预测API：返回字段prob同样表示算法结果的置信度，范围为0到1。 - 预置能力服务预测API：返回字段prob表示每个识别结果的置信度，范围为0到1。 - 统一识别接口（RecognizeAllText）：返回字段KeyConfidence和ValueConfidence分别表示字段名称和字段值的置信度，范围为0到100。 - 银行承兑汇票识别：返回字段keyProb和valueProb分别表示字段名称和字段值的置信度。 - 电子面单识别：返回字段keyProb和valueProb分别表示字段名称和字段值的置信度。

3. 如何获取置信度

要获取置信度信息，您需要确保以下几点： - 选择支持置信度输出的模型或API：并非所有OCR模型都默认返回置信度，因此需要确认所使用的模型是否支持该功能。 - 检查返回参数：在调用API时，查看返回的JSON数据中是否包含置信度相关字段（如prob、KeyConfidence、ValueConfidence等）。 - 配置输出选项：某些接口可能需要通过特定参数启用置信度输出。例如，在RecognizeAllText接口中，可以通过设置OutputCoordinate参数来控制是否返回坐标和置信度信息。

4. 示例代码

以下是一个基于RecognizeAllText接口的示例，展示如何获取置信度信息：

{
  "RequestId": "F25FBAB4-665A-5D85-8AEF-39AE29F7D588",
  "Data": {
    "KvDetails": {
      "address": {
        "KeyName": "address",
        "KeyConfidence": 100,
        "Value": "XX省XX市XX街道",
        "ValueConfidence": 98
      }
    }
  }
}

在此示例中，KeyConfidence和ValueConfidence分别表示字段名称和字段值的置信度。

5. 注意事项

置信度阈值：建议根据实际应用场景设定置信度阈值，低于阈值的结果可能需要人工复核。
模型差异：不同模型的置信度计算方式可能有所不同，请参考具体模型的文档说明。
权限问题：部分接口可能需要特定权限才能访问置信度信息，例如RecognizeWaybill接口中提到的权限限制。

如果您正在使用ModelScope的pipeline，建议查阅对应模型的文档或联系技术支持，确认其是否支持置信度输出以及具体的实现方式。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问