阿里云的文字识别OCR服务在完成识别后,会将结果以JSON格式返回。特别的,调用网络图片API成功后,在“JSON返回结果”中,您可以看到result字段。这个字段包含了图片中的文字块数目、文字块排列顺序、具体文本内容、所在位置以及置信度等信息。
例如,如果您调用成功,且识别出2个文字块,分别代表图片中的2行文字,那么在返回的JSON结果中,“words_block_count”表示识别出的文字块数目,"words_block_list"表示按照图片文字从上到下、从左到右排列的文字块列表,"words"为识别出来的文本内容,而"confidence"则表示该字段的置信度。每个文字块的位置信息由"location"表示,它采用图像坐标系。比如第一个文字块左上角顶点的坐标为 [184,606]。
此外,除了基本的文本识别外,如果您需要进行更复杂的操作例如键值对提取或表格识别,您可以设置相应的参数来获取这些信息。当输入参数“kv”和“table”都为“true”时,服务会返回键值对提取结果和表格识别结果。
是的,文字识别OCR技术在题目识别后的结果方面,有标准的API转换结果。通常这些API会返回包含多个字段的结果。例如,腾讯优图的印刷体文字识别API在成功调用后,其返回的JSON结果中会包含"result"字段。这个字段的信息很丰富,其中包括了文字块数目、文字块排列顺序、具体文本内容、所在位置以及置信度等信息。
此外,一些其他的OCR服务提供商也提供了类似的功能,比如阿里云表格识别和百度AI开放平台的表格文字识别等。这些服务不仅能够高精度地识别文字,还能将识别结果结构化输出,包括各表格的表头表尾内容、单元格文字内容及其行号列号等信息。
总的来说,这些API可以将题目识别的结果转换为结构化的数据,方便进行后续的处理和分析。但需要注意的是,由于不同的OCR服务提供商可能提供的API和返回结果的格式可能会有所不同,因此在使用时需要参考具体的API文档来进行操作。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。