在文字识别ocr中,这个OCR识别后,又把识别完毕的内容1:1还原出来,这个是用什么方式实现的?如果我想拿到OCR识别完毕的结果后,自己再生成表格,这个生成表格的过程,有什么解决方案吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
这是excel识别。
RecognizeTableOcr - 表格识别https://help.aliyun.com/document_detail/442251.html?spm=a2c4g.11186623.0.i16
接口说明
本接口适用场景
阿里云表格识别,是阿里云官方自研OCR文字识别产品,支持对多种表格格式(有线表格、条纹表格、无线表格)进行智能文字识别并结构化输出识别结果。
阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据,历经多年沉淀打磨,具有服务稳定、操作简易、实时性高、能力全面等几大优势。
本接口图片示例
表格智能解析接口可以进行表格抽取和理解,从PDF或图片格式的表格文档中提取出表格样式、表格内容、文本KV、表格KV等信息。
表格智能解析接口为异步接口,需要先调用表格智能解析异步提交服务SubmitTableUnderstandingJob接口进行异步任务提交,然后调用表格智能解析结果查询服务GetTableUnderstandingResult接口进行结果轮询,建议每10秒轮询一次,最多轮询120分钟,如果120分钟还未查询到处理完成结果,则视为处理超时。
当异步任务处理提交后,用户可以在处理结束后的24小时之内查询处理结果,超过24小时后将无法查询到处理结果。
https://help.aliyun.com/document_detail/450742.html?spm=a2c4g.442251.0.0.7394279bDlSiGZ