开发者社区 > 视觉智能 > 文字识别 > 正文

文字识别OCR题目识别后的结果,有没有标准的api转换结果?

文字识别OCR题目识别后的结果,有没有标准的api转换结果?

展开
收起
真的很搞笑 2024-01-04 07:57:58 88 0
3 条回答
写回答
取消 提交回答
  • 阿里云的文字识别OCR服务在完成识别后,会将结果以JSON格式返回。特别的,调用网络图片API成功后,在“JSON返回结果”中,您可以看到result字段。这个字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置以及置信度等信息。

    例如,如果您调用成功,且识别出2个文字块,分别代表图片中的2行文字,那么在返回的JSON结果中,“words_block_count”表示识别出的文字块数目,"words_block_list"表示按照图片文字从上到下、从左到右排列的文字块列表,"words"为识别出来的文本内容,而"confidence"则表示该字段的置信度。每个文字块的位置信息由"location"表示,它采用图像坐标系。比如第一个文字块左上角顶点的坐标为 [184,606]。

    此外,除了基本的文本识别外,如果您需要进行更复杂的操作例如键值对提取或表格识别,您可以设置相应的参数来获取这些信息。当输入参数“kv”和“table”都为“true”时,服务会返回键值对提取结果和表格识别结果。

    2024-01-06 11:54:32
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    是的,文字识别OCR技术在题目识别后的结果方面,有标准的API转换结果。通常这些API会返回包含多个字段的结果。例如,腾讯优图的印刷体文字识别API在成功调用后,其返回的JSON结果中会包含"result"字段。这个字段的信息很丰富,其中包括了文字块数目、文字块排列顺序、具体文本内容、所在位置以及置信度等信息。

    此外,一些其他的OCR服务提供商也提供了类似的功能,比如阿里云表格识别和百度AI开放平台的表格文字识别等。这些服务不仅能够高精度地识别文字,还能将识别结果结构化输出,包括各表格的表头表尾内容、单元格文字内容及其行号列号等信息。

    总的来说,这些API可以将题目识别的结果转换为结构化的数据,方便进行后续的处理和分析。但需要注意的是,由于不同的OCR服务提供商可能提供的API和返回结果的格式可能会有所不同,因此在使用时需要参考具体的API文档来进行操作。

    2024-01-04 17:56:14
    赞同 展开评论 打赏
  • 目前没有 ,此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

    2024-01-04 10:41:37
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
Spring Boot2.0实战Redis分布式缓存 立即下载
CUDA MATH API 立即下载
API PLAYBOOK 立即下载