文字识别OCR长文档识别,上传识别文档出错。怎么解决?

文字识别OCR长文档识别,上传识别文档出错。怎么解决?请求ID: 0abb7ee117096890271681826eb8bd 84d4d1a351cfe26382e02c1131575507.jpg

展开
收起
三分钟热度的鱼 2024-03-13 16:03:56 92 分享 版权
阿里云 AI 助理回答

根据您提供的信息,文字识别OCR长文档识别上传文档时出错,可能的原因和解决方法如下:


1. 检查请求参数是否完整

  • 根据知识库资料,OCR接口调用时需要确保所有必填参数均已正确传递。例如:
    • Urlbody 字段需二选一,不可同时为空或同时传递。
    • 如果使用 Type 参数,必须指定图片类型(如票据、证件等),否则可能导致识别失败。
  • 建议操作
    • 确认请求中是否正确传递了 Urlbody 参数。
    • 检查 Type 参数是否与实际图片类型一致。

2. 验证文档格式和大小限制

  • 长文档信息抽取对上传的文档有严格的格式和大小要求:
    • 支持的文档格式包括 PDF(单文件不超过 20MB,建议单 PDF 文件不超过 5 页)和图片(JPG、JPEG、PNG,单文件不超过 10MB)。
    • 图片尺寸限制:单张图片最长边不超过 8192 像素,最短边不小于 15 像素;当长边超过 1024 像素时,长宽比不得超过 50:1。
  • 建议操作
    • 确保上传的文档符合上述格式和大小限制。
    • 如果文档过大,可尝试分割为多个小文件后重新上传。

3. 确认数据质量

  • 数据质量直接影响 OCR 识别效果。以下情况可能导致识别失败:
    • 文档字迹模糊、倾斜、反光或存在遮挡。
    • 单字大小不在推荐范围(10-50 像素)内。
  • 建议操作
    • 使用清晰、端正的扫描件或高质量图片进行上传。
    • 确保文档内容无明显干扰(如印章、水印等)。

4. 检查 CutType 参数缺失问题

  • 根据知识库资料,错误信息中提到 illegalCutType,这通常是因为 CutType 参数缺失或配置错误导致的。
  • 建议操作
    • 确认请求中是否包含 CutType 参数,并确保其值符合接口文档要求。

5. 联系技术支持

  • 如果以上步骤均无法解决问题,建议通过以下方式联系阿里云技术支持团队:
    • 加入钉钉群获取实时帮助:
      • 【官方】阿里云OCR文档自学习用户答疑群:26560014923
      • 【官方】阿里云OCR公共云客户交流群:35208328
      • 【官方】阿里云文档智能客户交流群:44854217
  • 提供请求 ID(如 0abb7ee117096890271681826eb8bd)以便技术支持快速定位问题。

总结

请按照以下步骤逐一排查问题: 1. 确认请求参数完整性,特别是 Url/bodyType 参数。 2. 检查文档格式、大小和图片尺寸是否符合要求。 3. 确保上传文档的质量满足 OCR 识别需求。 4. 检查是否存在 CutType 参数缺失或配置错误。 5. 如仍无法解决,请联系阿里云技术支持并提供请求 ID。

希望以上信息能帮助您快速解决问题!

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答

文字识别技术可以灵活应用于证件文字识别、发票文字识别、文档识别与整理等行业场景,满足认证、鉴权、票据流转审核等业务需求。

热门讨论

热门文章

还有其他疑问?
咨询AI助理