文字识别OCR主要是将图片中的文字信息转换为可编辑文本,只能支持图片格式;达摩院的文档智能可以实现对PDF/Word/Excel/图片等各类非结构化和半结构化文档的智能自动化处理。相比于文字识别OCR处理固定板式的文档,达摩院文档智能能处理非固定版式且规则样式变化的多种格式文档。对于固定板式的文档图片识别,个人觉得OCR的准确率更高一些,而对于非固定板式的文档,达摩院文档智能识别效果更好一些,根据不同的应用场景选用不同的产品,这样对业务才更友好。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。