还记得上月,海康威视研究院预研团队基于深度学习技术研发的OCR(Optical Character Recognition,图像中文字识别)技术,在ICDARRobust Reading竞赛数据集竞赛中刷新全球最好成绩,并在“互联网图像文字”、“对焦自然场景文字”和“随拍自然场景文字”三项挑战的文字识别(Word Recognition)任务中获得第一吗?《海康威视深度学习“文字识别技术”国际竞赛中获第一》
安防OCR技术实力彰显 市场应用其实很广
借助先进的OCR技术,海康威视的文字识别系统能够应对更为复杂文字识别场景,如污损及模糊、背景干扰及形变、恶劣天气等。目前,基于全新OCR技术的海康威视车牌识别系统已经覆盖全球六十余个国家和地区。基于车牌识别技术的卡口、电子警察、出入口控制、停车系统等应用也已经全面铺开。
这里是不是有人要问OCR技术是个什么?小编这就先科普下:OCR 技术是通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。具体的说,OCR意为光学字符识别,即自动识别通过扫描仪、数码相机、摄像机等得到的图像中的文字(含字符)或书写在纸面上的文字,便于存储、编辑和检索。
事实上,OCR智能识别技术还可以进行细分,下面介绍下几种OCR智能识别技术。
1.证件OC识别
此类最开始是基于PC的,近几年开始向移动端发展,主要有android,ios平台的SDK,目前成熟的有身份证识别,行驶证识别,驾驶证识别,护照识别等。
2.银行卡OCR识别
此类技术是2014年以后开始兴起的技术,主要用于移动支付绑卡,是一项非常有技术含量的细分OCR技术,目前有一些APP已经在用,如拉卡拉,宜人贷,支付宝,微信等。
3.名片OCR识别
这一类技术也非常成熟了,目前市场上名片管理的APP也非常多,多半已经使用这类技术。
4.文档OCR识别
其实OCR最早的时候就是主要识别文档,主要针对图书,报刊等,把这些纸质文档进行电子化。但这类技术主要是借助在扫描仪的基础上得到快速发展,目前识别率也非常高。移动端的文档OCR识别,近几年也有不少成功的应用。
5.票据类OCR识别
这类技术主要是针对各种不同格式的票据,主要基于模板机制,需要针对不同的票据,定制不同的识别要素,这项技术也称要素识别OCR,最早的其实运用的是银行行业,主要在银行的后督中,有非常成功的应用。
6.手写OCR识别
其实手写OCR可以分为两类,一类是书面手写的识别,这类技术没有得到很好的应用,只有是因为每个人的手写习惯不太一样。目前能识别好是手写的数字和字母,因为这些差异不会太大,手写的汉子,难度还是非常大的。第二类是联机手写技术:联机手写技术得到了非常好的应用,各种手写输入法,都是基于这个技术。可能有些人会问,同时手写OCR智能识别技术,为了联机手写识别的非常好,其实有两点,一是联机手写是单字识别,不用做切分,OCR里最难的不是比对识别,而是字符切分。二是因为联机手写技术是单字选择,有人进行判断。所以应用的非常广。
7.车牌OCR识别
车牌识别技术相信大家都不会觉得陌生,智能交通,小区停车场等,都有很好的应用,车牌识别的原理其实技术对车牌进行OCR识别,再进行比对的过程。也是相当成熟的技术。
目前,人工智能蓬勃发展,OCR作为AI黑技术的重要组成部分已经深深融入人们的日常生活工作当中。以当下最流行的身份证识别为例,最简单的描述它的工作流程包括,图像的采集输入、图像预处理、图像文字的分割与识别、信息关键词归属的判断和处理,以及OCR识别信息的输出。在这五大模块中,图像的文字分割与识别作为核心技术在开源的OCR中,作为一个技术开发新人,无法从开源的OCR内获取到有用的算法或代码。例如谷歌的OCR开源项目,Tesseract-OCR需要通过复杂的配置和训练方式才有可能接近自己想要的结果。冗余的代码让工程师在代码熟悉阶段就对OCR技术望而怯步。
其实仔细观察,我们会发现OCR识别技术在身边生活中随处可见,比如网上购物手机充值要用移动支付、理财贷款要找互联网金融、转账要用手机银行、股票开户要用证券移动、公司票据信息录入存档等,在这些业务里你会发现很多环节都已经用到了OCR技术,在录入身份证和银行卡证件或发票等票据信息时现在不需要再手动输入,通过OCR识别,信息就会自动识别并录入存档,速度快而且准确度提升很多。
随着未来业务流程的自动化、智能化和多样化趋势,OCR识别将会被更广泛应用,很多场景会实现操作的实时识别录入存档,届时人们将真正感受到智能化生活所带来的便利,看到人工智能时代发展将收获跨越式的发展。
本文转自d1net(转载)