文字识别OCR长文档识别，上传识别文档出错。怎么解决？

文字识别OCR长文档识别，上传识别文档出错。怎么解决？请求ID: 0abb7ee117096890271681826eb8bd

展开

收起

三分钟热度的鱼 2024-03-13 16:03:56 464 版权

阿里云 AI 助理回答

根据您提供的信息，文字识别OCR长文档识别上传文档时出错，可能的原因和解决方法如下：

1. 检查请求参数是否完整

根据知识库资料，OCR接口调用时需要确保所有必填参数均已正确传递。例如：
- Url 和 body 字段需二选一，不可同时为空或同时传递。
- 如果使用 Type 参数，必须指定图片类型（如票据、证件等），否则可能导致识别失败。
建议操作：
- 确认请求中是否正确传递了 Url 或 body 参数。
- 检查 Type 参数是否与实际图片类型一致。

2. 验证文档格式和大小限制

长文档信息抽取对上传的文档有严格的格式和大小要求：
- 支持的文档格式包括 PDF（单文件不超过 20MB，建议单 PDF 文件不超过 5 页）和图片（JPG、JPEG、PNG，单文件不超过 10MB）。
- 图片尺寸限制：单张图片最长边不超过 8192 像素，最短边不小于 15 像素；当长边超过 1024 像素时，长宽比不得超过 50:1。
建议操作：
- 确保上传的文档符合上述格式和大小限制。
- 如果文档过大，可尝试分割为多个小文件后重新上传。

3. 确认数据质量

数据质量直接影响 OCR 识别效果。以下情况可能导致识别失败：
- 文档字迹模糊、倾斜、反光或存在遮挡。
- 单字大小不在推荐范围（10-50 像素）内。
建议操作：
- 使用清晰、端正的扫描件或高质量图片进行上传。
- 确保文档内容无明显干扰（如印章、水印等）。

4. 检查 CutType 参数缺失问题

根据知识库资料，错误信息中提到 illegalCutType，这通常是因为 CutType 参数缺失或配置错误导致的。
建议操作：
- 确认请求中是否包含 CutType 参数，并确保其值符合接口文档要求。

5. 联系技术支持

如果以上步骤均无法解决问题，建议通过以下方式联系阿里云技术支持团队：
- 加入钉钉群获取实时帮助：
  - 【官方】阿里云OCR文档自学习用户答疑群：26560014923
  - 【官方】阿里云OCR公共云客户交流群：35208328
  - 【官方】阿里云文档智能客户交流群：44854217
提供请求 ID（如 0abb7ee117096890271681826eb8bd）以便技术支持快速定位问题。

总结

请按照以下步骤逐一排查问题： 1. 确认请求参数完整性，特别是 Url/body 和 Type 参数。 2. 检查文档格式、大小和图片尺寸是否符合要求。 3. 确保上传文档的质量满足 OCR 识别需求。 4. 检查是否存在 CutType 参数缺失或配置错误。 5. 如仍无法解决，请联系阿里云技术支持并提供请求 ID。

希望以上信息能帮助您快速解决问题！

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答