文字识别OCR题目识别后的结果，有没有标准的api转换结果？

展开

收起

真的很搞笑 2024-01-04 07:57:58 362 版权

3 条回答

写回答

取消提交回答

sunrr

阿里云的文字识别OCR服务在完成识别后，会将结果以JSON格式返回。特别的，调用网络图片API成功后，在“JSON返回结果”中，您可以看到result字段。这个字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置以及置信度等信息。

例如，如果您调用成功，且识别出2个文字块，分别代表图片中的2行文字，那么在返回的JSON结果中，“words_block_count”表示识别出的文字块数目，"words_block_list"表示按照图片文字从上到下、从左到右排列的文字块列表，"words"为识别出来的文本内容，而"confidence"则表示该字段的置信度。每个文字块的位置信息由"location"表示，它采用图像坐标系。比如第一个文字块左上角顶点的坐标为 [184,606]。

此外，除了基本的文本识别外，如果您需要进行更复杂的操作例如键值对提取或表格识别，您可以设置相应的参数来获取这些信息。当输入参数“kv”和“table”都为“true”时，服务会返回键值对提取结果和表格识别结果。

2024-01-06 11:54:32

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

是的，文字识别OCR技术在题目识别后的结果方面，有标准的API转换结果。通常这些API会返回包含多个字段的结果。例如，腾讯优图的印刷体文字识别API在成功调用后，其返回的JSON结果中会包含"result"字段。这个字段的信息很丰富，其中包括了文字块数目、文字块排列顺序、具体文本内容、所在位置以及置信度等信息。

此外，一些其他的OCR服务提供商也提供了类似的功能，比如阿里云表格识别和百度AI开放平台的表格文字识别等。这些服务不仅能够高精度地识别文字，还能将识别结果结构化输出，包括各表格的表头表尾内容、单元格文字内容及其行号列号等信息。

总的来说，这些API可以将题目识别的结果转换为结构化的数据，方便进行后续的处理和分析。但需要注意的是，由于不同的OCR服务提供商可能提供的API和返回结果的格式可能会有所不同，因此在使用时需要参考具体的API文档来进行操作。

2024-01-04 17:56:14

赞同展开评论
芯在这

目前没有，此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

2024-01-04 10:41:37

赞同展开评论

文字识别OCR题目识别后的结果，有没有标准的api转换结果？

文字识别

相关文章

热门讨论

热门文章