文字识别ocr中我们的需求是要识别 pdf 中的内容,包含文本,图片以及图片格式的表格,图片可能是横向的。哪个接口更合适呢?类似与这样的 pdf 文件。
文字识别 OCR 提供几种不同的识别方案,包括文本识别、图片识别和表格识别。
对于 PDF 文件中的内容,可以根据不同的需求选用相应的 OCR 方案,一般情况下可以采用以下方法:
此外,文字识别 OCR 可以智能识别 PDF 文件中的表格内容,并返回表格结构信息。
最后,在使用文字识别 OCR 解决 PDF 文件的文本、图片和表格时,应根据实际需要选取相应的方案。
楼主你好,看了你的问题,阿里云OCR中的pdf表格识别
和pdf文档识别
接口可能更适合你。
pdf表格识别
接口可以识别 PDF 中的表格,支持表格中包含文字和图片。
pdf文档识别
接口可以识别 PDF 中的文字和图片,包括横向的图片。
这里,你可以根据实际情况选择使用相应的接口。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。