在文字识别ocr中，纸质表格识别后能返回给出一个字典形式能明确知道它对应的key与value值吗？

在文字识别ocr中，纸质表格识别后，能返回给出一个字典形式，能明确知道它对应的key与value值吗？我们的同事试过了，识别不了，而且识别时和我设置的识别区不一致？

展开

收起

小小鹿鹿鹿 2023-10-09 12:52:41 314 版权

3 条回答

写回答

取消提交回答

sunrr
阿里云的表格识别API "RecognizeTableOcr - 表格识别"返回的结果是一个JSON对象，其中包含了识别到的表格数据。这个JSON对象的每一行代表表格的一行，每一列代表表格的一列，每个单元格的值对应于JSON对象中的一个键值对。

例如，如果识别到的表格如下：
```
姓名  年龄
张三  28
李四  35
```
那么，API返回的JSON对象可能会如下所示：
```
{
    "姓名": "张三",
    "年龄": "28"
}
```
在这个例子中，"姓名"和"年龄"分别是JSON对象中的两个键，而"张三"和"28"分别是它们对应的两个值。

如果你的同事发现识别结果和他设置的识别区不一致，可能是因为他在设置识别区时出现了错误。他可能需要检查他的代码，确保他正确设置了识别区的范围和大小。

至于你提到的"识别不了"的问题，可能是因为你的图片质量不高，或者图片中的表格格式复杂，这都可能导致OCR识别失败。你可以尝试提高图片的分辨率，或者简化表格的格式，看看是否能改善识别的效果。
2023-10-09 13:54:49

赞同展开评论
Star时光
在文字识别 OCR 中，对于纸质表格的识别，根据阿里云的文档，返回的结果通常是一个结构化的表格数据，以 JSON 格式表示。对于每个识别出的表格单元格，会提供相应的行号、列号和文本内容。

然而，由于文字识别是基于图像进行分析和处理的技术，其准确性可能受到多种因素的影响，如图像质量、表格布局复杂性等。因此，可能会出现以下情况：
1. 识别不准确：由于图像质量、表格布局等原因，OCR 可能无法完全准确地识别所有表格单元格。这可能导致返回的结果与你预期的不一致。
2. 识别区域不一致：如果你设置了特定的识别区域（ROI）用于识别表格，但返回的结果与你的设置不一致，可能是由于识别算法对图像进行了自适应处理，并尝试找到最佳的表格边界。
要处理这些问题，可以尝试以下方法：
1. 改善图像质量：优化图像质量可以提高 OCR 的准确性。确保拍摄或扫描的图像清晰、亮度适当，并尽量避免图像模糊、倾斜或有阴影等问题。
2. 调整识别区域：如果返回的结果与你的预期不一致，可以尝试调整识别区域的设置。根据表格的实际布局和边界，适当调整识别区域以获得更准确的结果。
3. 后处理与校正：在获取到 OCR 的识别结果后，你可以对结果进行后处理和校正。例如，通过使用自然语言处理技术分析文本内容，并根据上下文来确定每个识别结果的具体含义。
4. 使用其他算法或工具：如果阿里云 OCR 的识别结果不符合你的需求，你可以考虑尝试其他的 OCR 算法或工具。市场上有多种 OCR 引擎可供选择，你可以根据实际情况和需求进行评估。
2023-10-09 13:25:48

赞同展开评论
小小杳杳杳

可以用自学习的表格模版。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

2023-10-09 13:25:49

赞同展开评论

在文字识别ocr中，纸质表格识别后能返回给出一个字典形式能明确知道它对应的key与value值吗？

文字识别

相关文章

热门讨论

热门文章