文字识别

首页 标签 文字识别
【OCR】CentOS7下编译安装tesseract-ocr
什么是tesseract-ocr OCR(Optical Character Recognition):光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程。 Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。
Tesseract-OCR的简单使用与训练
Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
AOE工程实践-银行卡OCR里的图像处理
AOE工程实践-银行卡OCR里的图像处理 作者:杨科 近期我们开发了一个银行卡 OCR 项目。需求是用手机对着银行卡拍摄以后,通过推理,可以识别出卡片上的卡号。 工程开发过程中,我们发现手机拍摄以后的图像,并不能满足模型的输入要求。
Oracle 无备份情况恢复ocr和olr
Oracle 无备份情况恢复ocr和olr  Oracle 11.2 GI中OLR损坏的修复方法  一、先关闭GI,命令不再贴出来了,参见: http://blog.
支付宝端智能化探索与实践 | xMedia:多媒体端智能应用框架
除扫福以外,支付宝中还有大量的此类需求,如银行卡识别、身份证识别等,xMedia 多媒体端智能应用框架便由此衍生出来。
AI赋能案例—阿里云身份证OCR识别助力实现“无接触”式政务服务!
  2020年初的这场疫情,是一场对突发性公共卫生事件应急处置的大考,也是对数字政务体系能力的检验。在保证不影响办事效率的情况,如何减少人员的接触是政务场景下的“防疫”关键!日前由一窗(北京)互联网科技研究院结合阿里云视觉智能开放平台(vision.aliyun.com)上的身份证OCR识别算法,自主研发的「大厅出入自助登记系统」已正式上线,该系统既可以提升安全防范水平,同时也可以提高工作效率,确保实体大厅办事运行更加平稳、安全和有序。
开源 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字。目前大部分办公软件还无法实现类似的功能,因此遇到类似的问题时,我们只能自己动手解决。
免费试用