细数自然环境OCR应用,牵手机器人最具市场前景

本文涉及的产品
通用文字识别,通用文字识别 200次/月
文档理解,结构化解析 100页
OCR统一识别,每月200次
简介:

虽然目前的应用范围尚未扩大,但自然环境OCR的市场潜力是不可小觑的。

\

从古至今,文字经历了数代变革,最终发展成为现在的简体字。近来以来,随着科技的发展,人类变得越来越“懒”,从抛弃纸笔投入电脑的怀抱,再到现在从键盘到语音的转移。虽然不管如何发展,文字依然是人们不可丢弃的东西,但是出于让生活更便利的目的,它也在随着科技而发生变化,比如担当着人工智能基础之一的文字识别技术(OCR)。

OCR是指光学设备(扫描仪、数码相机等)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,其本质就是利用光学设备去捕获图像并识别文字,将人眼的能力延伸到机器上。此概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。

\

到目前为止,已经有不少专注于文字识别的公司,并且也推出了相关系列的产品,比如汉王的名片王、国外的ABBYY、Google等。不过,由于人类多方面需求的进一步扩大与提升,传统OCR已经不能填补这些空洞,而自然场景OCR就在这样的需求下应运而生。如此,自然场景OCR都用到了哪些领域?

\

自然环境OCR+机器人,让人机交互更自然

说到人机交互,大多人想到的都是语音交互,毕竟这是人类之间运用率最高的交流方式。但是,纵然现在语音识别的技术已经发展的相当成熟,可交互方式并不能仅仅局限于这一种,肢体、眼睛等等都是一个交互过程中必不可少的东西。

出于天性,人们喜欢与他人分享自己喜欢的东西,比如一部影片、一本书、一个活动等等,在这其中,文字的存在理所当然,眼睛的作用也就显得不容忽视。以陪护机器人为例,孩子们都喜欢色彩斑斓、嵌有图片的书籍,而在阅读的过程中,他们总会碰到不认识的字,这时候,陪护机器人需要通过眼睛扫描书页,再经过算法识别出其中的文字,从而才能从物联网中找出相关的答案。如果是传统的OCR,此时文字周边的色彩就会对文字识别产生一定的干扰,而这是自然环境OCR所解决的问题之一,目前相关机构也取得了相当大的进展。

\

另外,当机器人普及,不管是生活还是办公,人们也会要求陪护机器人去取一些东西。如果只是依靠图像识别的话,预计机器人有八成的可能会拿错东西,毕竟图像识别仅能识别出形状、颜色等因素,而这番套路在同种包装的番茄酱与草莓酱的面前是没有用武之地的。若要求机器人在拿取物品方面能够达到技改的准确率,自然环境OCR是必然选择(传统OCR难以识别曲面字体)。

\

自然环境OCR+翻译,走遍天下都不怕

对于大多国内观众而言,等待国外剧集的熟肉是一个剧迷的必经过程;出国旅游时,我们最怕的就是孤身一人……这种种现象的出现只因为一个原因——语言不通。

外面的世界是一个多样的世界,文字也被人们以多种形式呈现出来,像多个字一笔带过的,与背景几乎融为一体的,抽象字体等等,这些都是出门在外经常碰得到的。为了解决这个问题,Google、百度等科技企业都推出了翻译软件,不过,经过镁客君亲身测试,对于光线明亮的方正字体,这些软件的翻译效果还是不错的,但是一旦涉及艺术字,结果就悲剧了,可能字都识别不出来,更何谈翻译。

对于此类自然环境之中的文字,目前的自然环境OCR虽然不能达到完美的效果,但基于出国游旅客人数的日益增长,此类翻译软件必然是未来的一个趋势。既然翻译软件的势头如此之好,作为其中关键技术的自然环境OCR,理所当然的将受到人们的关注。

\

从当前的情况来看,在传统OCR的领域之内,作为人工智能基础之一、计算机视觉分支之一的自然环境OCR的应用范围并没有进行太多的扩充。作为一项技术而言,这也是一个好现,在技术尚未提升到满意的高度、没有挖到消费者更深层次的需求时,过快的市场占领只会根基不稳,比如现在的智能手环,火的很快,临了却因为鸡肋而遭到广大消费者的不满,面临着众多厂商退出的尴尬。

不过,虽然没有过多的扩充,但机器人与翻译是自然环境OCR目前来讲最容易进入的两大领域,其中,机器人更是目前最具前景的领域。单单在陪护机器人方面,根据ZDC互联网调研中心截止2016年9月的数据显示,在机器人产品用户关注度分布占比中,陪护机器人用户关注度高达32.2%,如果算上服务机器人,总关注度达到了51%,而此前根据IFR的统计,到2017年,全球服务机器人市场容量将接近500亿元。在如此利好情形之下,若自然环境OCR能够完善技术,狠抓用户需求,其市场必然也很有看头。


原文发布时间: 2016-11-01 19:00
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
2月前
|
机器学习/深度学习 存储 算法
【水下机器人建模】基于QLearning自适应强化学习PID控制器在AUV中的应用研究(Matlab代码实现)
【水下机器人建模】基于QLearning自适应强化学习PID控制器在AUV中的应用研究(Matlab代码实现)
276 0
|
8月前
|
存储 人工智能 监控
大牛直播SDK在四足机器人和无人机巡检中的创新应用方案
在工业4.0和智能化浪潮下,传统巡检方式正经历深刻变革。四足机器人与无人机凭借灵活机动性和高效巡检能力崭露头角,而大牛直播SDK则赋予其实时直播与智能互动功能。本文介绍大牛直播SDK的核心优势、在四足机器人和无人机巡检中的应用方案,以及技术实现要点和未来展望,展示智能巡检的广阔前景。
275 6
|
3月前
|
存储 人工智能 机器人
别再只做聊天机器人:AI 应用商业闭环的工程落地指南,免费体验中
本文介绍了如何通过阿里云百炼平台创建一个星座运势分析AI智能体,并集成支付宝MCP服务实现支付闭环。解决AI产品无法直接变现的问题,完成“服务-支付-交易”全流程闭环,帮助开发者快速实现商业化。
|
9月前
|
机器人 API 数据安全/隐私保护
【最佳实践系列】通过AppFlow,支持飞书机器人调用阿里云百炼应用
本文介绍了如何创建并配置飞书应用及机器人,主要包括三个步骤:1. 登录飞书开发者后台,创建企业自建应用并添加机器人卡片和API权限;2. 创建AppFlow连接流,配置飞书平台凭证和阿里云百炼鉴权凭证,发布WebhookUrl,并在飞书开放平台配置事件订阅;3. 将机器人添加到群聊中,通过@机器人实现互动。以及通过AppFlow连接流集成阿里云百炼应用服务。此过程详细描述了从应用创建到机器人添加的全流程,帮助开发者快速集成飞书机器人功能。
1801 10
|
5月前
|
机器学习/深度学习 人工智能 机器人
模仿学习在机器人“接触丰富”任务中的应用
本文结合近期发表的一篇综述性论文,简要介绍了机器人技术中的模仿学习(Imitation Learning)、以及接触丰富(Contact-Rich)任务这两个概念
189 41
|
5月前
|
人工智能 边缘计算 自然语言处理
大模型应用实践:2025年智能语音机器人厂商推荐和方案详解
随着数字化转型加速,AI客服机器人市场规模预计2025年突破500亿美元,年复合增长率超25%。其发展由语音交互升级、垂直场景解决方案成熟及多模态融合与边缘计算普及三大趋势驱动。文章分析了智能语音机器人的选型核心维度,包括技术性能、场景适配、数据治理与成本效益,并对比了国内外代表厂商如合力亿捷、Zendesk等的方案特点,为企业提供选型策略与落地建议,助力实现服务模式的根本性变革。
610 0
|
传感器 机器学习/深度学习 人工智能
仿生机器人:自然界灵感的工程应用
【10月更文挑战第14天】仿生机器人作为自然界灵感与工程技术的完美结合,正逐步改变着我们的生活和工作方式。通过深入了解其设计原理、关键技术、应用领域以及未来的发展趋势,我们可以更加清晰地看到仿生机器人在推动科技创新和社会发展中的重要作用。让我们共同期待仿生机器人在未来带来的更多惊喜和变革!
|
11月前
|
机器学习/深度学习 文字识别 自然语言处理
医疗行业化验单智能识别技术探讨:OCR与表格识别的应用
本文探讨了OCR与表格识别技术在医疗化验单处理中的应用,通过自动化数据提取和录入,显著提高了效率和准确性,降低了人工劳动强度和错误率。技术实现包括图像预处理、文字识别和表格解析等核心算法的优化,支持与医院信息管理系统集成,未来将向跨模态数据融合、多语言适配及数据安全方向发展。
1179 9
|
机器人 API 数据安全/隐私保护
AppFlow:支持飞书机器人调用百炼应用
本文介绍了如何创建并配置飞书应用及机器人,包括登录飞书开发者后台创建应用、添加应用能力和API权限,以及通过AppFlow连接流集成阿里云百炼服务,最后详细说明了如何将机器人添加到飞书群组中实现互动。
1228 5
|
机器学习/深度学习 传感器 算法
智能机器人在工业自动化中的应用与前景###
本文探讨了智能机器人在工业自动化领域的最新应用,包括其在制造业中的集成、操作灵活性和成本效益等方面的优势。通过分析当前技术趋势和案例研究,预测了智能机器人未来的发展方向及其对工业生产模式的潜在影响。 ###
799 9

热门文章

最新文章