开发者社区> 行者武松> 正文

细数自然环境OCR应用,牵手机器人最具市场前景

简介:
+关注继续查看

虽然目前的应用范围尚未扩大,但自然环境OCR的市场潜力是不可小觑的。

\

从古至今,文字经历了数代变革,最终发展成为现在的简体字。近来以来,随着科技的发展,人类变得越来越“懒”,从抛弃纸笔投入电脑的怀抱,再到现在从键盘到语音的转移。虽然不管如何发展,文字依然是人们不可丢弃的东西,但是出于让生活更便利的目的,它也在随着科技而发生变化,比如担当着人工智能基础之一的文字识别技术(OCR)。

OCR是指光学设备(扫描仪、数码相机等)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,其本质就是利用光学设备去捕获图像并识别文字,将人眼的能力延伸到机器上。此概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。

\

到目前为止,已经有不少专注于文字识别的公司,并且也推出了相关系列的产品,比如汉王的名片王、国外的ABBYY、Google等。不过,由于人类多方面需求的进一步扩大与提升,传统OCR已经不能填补这些空洞,而自然场景OCR就在这样的需求下应运而生。如此,自然场景OCR都用到了哪些领域?

\

自然环境OCR+机器人,让人机交互更自然

说到人机交互,大多人想到的都是语音交互,毕竟这是人类之间运用率最高的交流方式。但是,纵然现在语音识别的技术已经发展的相当成熟,可交互方式并不能仅仅局限于这一种,肢体、眼睛等等都是一个交互过程中必不可少的东西。

出于天性,人们喜欢与他人分享自己喜欢的东西,比如一部影片、一本书、一个活动等等,在这其中,文字的存在理所当然,眼睛的作用也就显得不容忽视。以陪护机器人为例,孩子们都喜欢色彩斑斓、嵌有图片的书籍,而在阅读的过程中,他们总会碰到不认识的字,这时候,陪护机器人需要通过眼睛扫描书页,再经过算法识别出其中的文字,从而才能从物联网中找出相关的答案。如果是传统的OCR,此时文字周边的色彩就会对文字识别产生一定的干扰,而这是自然环境OCR所解决的问题之一,目前相关机构也取得了相当大的进展。

\

另外,当机器人普及,不管是生活还是办公,人们也会要求陪护机器人去取一些东西。如果只是依靠图像识别的话,预计机器人有八成的可能会拿错东西,毕竟图像识别仅能识别出形状、颜色等因素,而这番套路在同种包装的番茄酱与草莓酱的面前是没有用武之地的。若要求机器人在拿取物品方面能够达到技改的准确率,自然环境OCR是必然选择(传统OCR难以识别曲面字体)。

\

自然环境OCR+翻译,走遍天下都不怕

对于大多国内观众而言,等待国外剧集的熟肉是一个剧迷的必经过程;出国旅游时,我们最怕的就是孤身一人……这种种现象的出现只因为一个原因——语言不通。

外面的世界是一个多样的世界,文字也被人们以多种形式呈现出来,像多个字一笔带过的,与背景几乎融为一体的,抽象字体等等,这些都是出门在外经常碰得到的。为了解决这个问题,Google、百度等科技企业都推出了翻译软件,不过,经过镁客君亲身测试,对于光线明亮的方正字体,这些软件的翻译效果还是不错的,但是一旦涉及艺术字,结果就悲剧了,可能字都识别不出来,更何谈翻译。

对于此类自然环境之中的文字,目前的自然环境OCR虽然不能达到完美的效果,但基于出国游旅客人数的日益增长,此类翻译软件必然是未来的一个趋势。既然翻译软件的势头如此之好,作为其中关键技术的自然环境OCR,理所当然的将受到人们的关注。

\

从当前的情况来看,在传统OCR的领域之内,作为人工智能基础之一、计算机视觉分支之一的自然环境OCR的应用范围并没有进行太多的扩充。作为一项技术而言,这也是一个好现,在技术尚未提升到满意的高度、没有挖到消费者更深层次的需求时,过快的市场占领只会根基不稳,比如现在的智能手环,火的很快,临了却因为鸡肋而遭到广大消费者的不满,面临着众多厂商退出的尴尬。

不过,虽然没有过多的扩充,但机器人与翻译是自然环境OCR目前来讲最容易进入的两大领域,其中,机器人更是目前最具前景的领域。单单在陪护机器人方面,根据ZDC互联网调研中心截止2016年9月的数据显示,在机器人产品用户关注度分布占比中,陪护机器人用户关注度高达32.2%,如果算上服务机器人,总关注度达到了51%,而此前根据IFR的统计,到2017年,全球服务机器人市场容量将接近500亿元。在如此利好情形之下,若自然环境OCR能够完善技术,狠抓用户需求,其市场必然也很有看头。


原文发布时间:2016-11-01 19:00
本文作者:韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
使用ModelScope社区搭建OCR应用
简介: 本文介绍通过ModelScope来完成光学字符识别(OCR)这一应用,该应用使用两个模型: ● 文本检测(ocr_detection) ● 文本识别(ocr_recognition)
616 0
AI之Robot:机器人Robot的简介、发展历史、案例应用之详细攻略
AI之Robot:机器人Robot的简介、发展历史、案例应用之详细攻略
254 0
ICASSP 2022 论文分享:语音增强与关键词检测联合优化技术在扫地机器人中的应用
ICASSP 2022 论文分享:语音增强与关键词检测联合优化技术在扫地机器人中的应用
348 0
轻量级深度卷积神经网络在农业机器人中的应用
最近,深度学习正随着训练过程简单化和准确化而变得越来越流行。对于旨在将研究转换为工业应用的研究者而言,这是一个至关重要的需求,例如机器人。
201 0
推出可拾取海量SKU的AI+机器人货品拣选解决方案,「梅卡曼德机器人」想要加速规模化应用
除制造业之外,物流业是智能化工业机器人规模应用的另一个重要细分领域。
596 0
带你读《工业机器人系统及应用》之二:机器人
本书聚焦于工业机器人,涵盖其组成结构、电气控制及实践应用,重点从使用的角度展开介绍,不涉及数学原理分析。书中综合了机械、控制、计算机、传感器、驱动等专业的知识,包含大量新近的工业机器人产品实例,并配有丰富的图表和数据手册,为机器人的设计、生产、布置、操作和维护提供全流程的详细指南。
753 0
擎朗李通:跨过服务机器人应用之殇,产业链是深坑 |【 远望实战派】
伴随海底捞智慧餐厅的亮相,最近擎朗机器人热刷了很多人的朋友圈。到底服务机器人是一个店家用来营销的噱头,还是真已到了替代人工的应用临界,我们这一期与擎朗机器人创始人李通聊聊服务机器人如何才能跨过应用之殇。
320 0
OCR:实现信息结构化提取 助力信息数字化管理 ——基于OCR的机动车销售统一发票识别提取自动化应用案例
为降低信息提取成本、优化业务处理效率,深源恒际依托自身在OCR技术上的积累,打造了机动车销售统一发票信息识别提取自动化解决方案,自动检测、识别、提取发票信息,并根据实际应用需求输出结构化文本,由计算机替代人工作业,高效、准确地完成信息提取。
4819 0
OCR如何读取皱巴巴的文件?深度学习在文档图像形变矫正的应用详解
OCR作为智能审核的重要环节,其识别准确率影响着最终审核效果的好坏,而来自扫描仪、智能手机的文档图像多存在卷曲、折叠。本文旨在利用深度学习算法对文档图像的形变进行矫正,从而提高OCR识别效果,为智能审核保驾护航。
2191 0
人工智能革命号角正在打响,机器人应用蔚然成风。
19世纪的工业革命,它创造了一个新的无产阶级,现在到了21世纪,人工智能的革命号角正在打响,目前的技术在某种程度上把人变成了神,展现了技术的颠覆力量,迸发的能量超乎想象,比如将人工智能和生物技术相互结合起来具备了设计和创造生命的能力。
1056 0
+关注
行者武松
杀人者,打虎武松也。
文章
问答
视频
文章排行榜
最热
最新
相关电子书
更多
当机器人拥抱消费品
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载
相关实验场景
更多