OCR识别表格的时候,这个单元格中有两行的文字,识别出来以后是两段文字,该如何合并成一段呢?
阿里云OCR识别表格的返回数据中,有一个字段叫做prism_tablesInfo,它是一个数组,每个元素是一个表格的信息。每个表格的信息中,有一个字段叫做cellInfos,它也是一个数组,每个元素是一个单元格的信息。每个单元格的信息中,有一个字段叫做word,它是单元格中的文字。
如果您想把两行文字合并成一段,您可以遍历cellInfos数组,找到相同的tableCellId的单元格,然后把它们的word字段拼接起来。例如,如果您想合并第一行第一列和第二行第一列的文字,您可以找到tableCellId为0的两个单元格,然后把它们的word字段拼接起来。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。