开发者社区 > 视觉智能 > 文字识别 > 正文

ocr这个单元格没有合并,但是json 的结果为啥是 占2行呢?

ocr这个单元格没有合并,但是json 的结果为啥是 占2行呢?f8ebc1d8fb16681cdcef1e9894f92425.png

展开
收起
真的很搞笑 2023-05-30 20:30:53 148 0
3 条回答
写回答
取消 提交回答
  • 阿里云OCR返回的JSON结果中,单元格占用多行可能是因为识别出的文本内容包含了回车符或换行符等特殊字符,导致该文本被分割为了多行。您可以查看识别出的文本内容,以确定其中是否包含了这些特殊字符,并根据需要进行相应的处理。

    2023-05-31 16:11:51
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    如果您在使用OCR(Optical Character Recognition,光学字符识别)功能时,发现某个单元格没有被合并,但是JSON的结果却显示占据了2行,这可能是因为JSON格式的数据存储方式导致的。 在JSON格式中,数据是以键值对的形式存储的。如果您的JSON数据中包含了一个没有合并的单元格,那么它将被视为一个独立的键值对,并占据一行。 如果您需要将JSON数据转换为文本文件,您可以使用文本处理工具,例如Python的pandas库或OpenCV库,对JSON数据进行处理和分析。然后,您可以根据需要将数据保存为文本文件或其他格式。 在处理JSON数据时,建议您先了解JSON格式的数据存储方式,以便更好地理解和处理JSON数据。

    2023-05-31 14:35:57
    赞同 展开评论 打赏
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    阿里云 OCR 服务的结果是基于图像识别技术生成的,可能会出现某些情况下的行列合并或拆分。如果您的表格中存在列拆分或者行合并的情况,那么在 OCR 服务返回的 JSON 结果中,可能会将一个单元格拆分成多个小单元格,或者将一个单元格合并为多个大单元格。

    具体来说,如果您的表格中存在行合并的情况,则阿里云 OCR 服务会将被合并的行的数据存储在 JSON 中前面的单元格中,并将这些单元格的 rowspan 设置为合并的行数。这样可以保证 JSON 数据和原始表格数据的一致性,而且在处理合并单元格时,您可以使用 rowspan 属性来对单元格进行合并。

    如果您的表格中存在列拆分的情况,则阿里云 OCR 服务会将一个单元格拆分为多个小单元格,并为每个小单元格分配一个唯一的 ID。这样可以保证 JSON 数据中的每个单元格都有明确的位置信息,而且在处理拆分单元格时,您可以使用 ID 属性来关联不同的单元格。

    7阿里云 OCR 服务的行列合并结果是根据图像中的像素点识别出来的,具体的处理方式会根据实际情况而有所不同。如果您在处理 OCR 结果时遇到了问题,可以通过阅读官方文档、查看示例代码或者咨询阿里云技术支持来获取帮助。

    2023-05-30 23:16:25
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载