开发者社区 > 视觉智能 > 文字识别 > 正文

在文字识别ocr中,纸质表格识别后能返回给出一个字典形式能明确知道它对应的key与value值吗?

在文字识别ocr中,纸质表格识别后,能返回给出一个字典形式,能明确知道它对应的key与value值吗?我们的同事试过了,识别不了,而且识别时和我设置的识别区不一致?

展开
收起
小小鹿鹿鹿 2023-10-09 12:52:41 104 0
3 条回答
写回答
取消 提交回答
  • 阿里云的表格识别API "RecognizeTableOcr - 表格识别"返回的结果是一个JSON对象,其中包含了识别到的表格数据。这个JSON对象的每一行代表表格的一行,每一列代表表格的一列,每个单元格的值对应于JSON对象中的一个键值对。

    例如,如果识别到的表格如下:

    姓名  年龄
    张三  28
    李四  35
    

    那么,API返回的JSON对象可能会如下所示:

    {
        "姓名": "张三",
        "年龄": "28"
    }
    

    在这个例子中,"姓名"和"年龄"分别是JSON对象中的两个键,而"张三"和"28"分别是它们对应的两个值。

    如果你的同事发现识别结果和他设置的识别区不一致,可能是因为他在设置识别区时出现了错误。他可能需要检查他的代码,确保他正确设置了识别区的范围和大小。

    至于你提到的"识别不了"的问题,可能是因为你的图片质量不高,或者图片中的表格格式复杂,这都可能导致OCR识别失败。你可以尝试提高图片的分辨率,或者简化表格的格式,看看是否能改善识别的效果。

    2023-10-09 13:54:49
    赞同 展开评论 打赏
  • 在文字识别 OCR 中,对于纸质表格的识别,根据阿里云的文档,返回的结果通常是一个结构化的表格数据,以 JSON 格式表示。对于每个识别出的表格单元格,会提供相应的行号、列号和文本内容。

    然而,由于文字识别是基于图像进行分析和处理的技术,其准确性可能受到多种因素的影响,如图像质量、表格布局复杂性等。因此,可能会出现以下情况:

    1. 识别不准确:由于图像质量、表格布局等原因,OCR 可能无法完全准确地识别所有表格单元格。这可能导致返回的结果与你预期的不一致。

    2. 识别区域不一致:如果你设置了特定的识别区域(ROI)用于识别表格,但返回的结果与你的设置不一致,可能是由于识别算法对图像进行了自适应处理,并尝试找到最佳的表格边界。

    要处理这些问题,可以尝试以下方法:

    1. 改善图像质量:优化图像质量可以提高 OCR 的准确性。确保拍摄或扫描的图像清晰、亮度适当,并尽量避免图像模糊、倾斜或有阴影等问题。

    2. 调整识别区域:如果返回的结果与你的预期不一致,可以尝试调整识别区域的设置。根据表格的实际布局和边界,适当调整识别区域以获得更准确的结果。

    3. 后处理与校正:在获取到 OCR 的识别结果后,你可以对结果进行后处理和校正。例如,通过使用自然语言处理技术分析文本内容,并根据上下文来确定每个识别结果的具体含义。

    4. 使用其他算法或工具:如果阿里云 OCR 的识别结果不符合你的需求,你可以考虑尝试其他的 OCR 算法或工具。市场上有多种 OCR 引擎可供选择,你可以根据实际情况和需求进行评估。

    2023-10-09 13:25:48
    赞同 展开评论 打赏
  • 可以用自学习的表格模版。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

    2023-10-09 13:25:49
    赞同 展开评论 打赏

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

相关电子书

更多
阿里云智能-印刷文字识别OCR-产品介绍 立即下载
阿里巴巴读光OCR 立即下载
印刷文字识别算法设计与在线服务 立即下载