语音识别:市场前景可观,但核心技术仍需突破

简介:

在CES 2017之后,语音识别成为了众人的关注焦点,而在市场规模扩大的背后,语音识别还不能完全满足人类的需求。

随着人工智能产品在生活中的渗透率越来越高,其中技术的发展也成为了众人关心的重点所在。作为人机自然交互的基本途径之一,近期以来,语音识别的发展不可谓不快速。

当下,诸如科大讯飞、百度等多家企业声称,其研发的语音识别技术已经达到了97%的准确率。而在日前,谷歌研究员公开表示其语音识别的错误率(将一个词语从语音转录成为文字时的错误率)自2012年以来已经降低了30%以上……纵观过去的2016年,谷歌、苹果和微软等多家科技巨头都公布了自己在语音识别上的进展和突破,而在接下来的时间里,语音识别也将是2017年的发展重点之一。

市场前景可观,而语音识别仍需突破

新兴产业市场广阔,推动语音识别技术发展

在刚刚过去不久的CES 2017展会上,我们见到了许多人工智能产品,要是来一场评比大赛,自动驾驶和智能家居绝对是主角。不过,再往深究,语音识别技术才是此次展会人工智能部分的“亮点”。

市场前景可观,而语音识别仍需突破

智能家居

在智能家居,不管是智能家电还是机器人,语音识别技术都是必备的基本功能之一。据知名市场调研公司《Markets And Markets》发布的调查报告称,全球智能家居市场规模将在2022年达到1220亿美元,2016-2022年年均增长率预测为14%。而在机器人方面,研究机构IDC预测,至2020年,全球机器人与相关服务市场规模将由2016年的915亿美元增至1880亿美元。从这两点数据来看,可想而知未来智能家居的市场之大。

在控制方式上,除了部分智能家电之外,语音控制已经成为了市场的主流,而这就是语音识别市场的商机。未来,作为人机自然交互的前提之一,语音识别必然是智能家居的发展趋势,只有语音识别的准确率接近完美,人机的自然交互才能继续开展。在智能家居市场的推动下,语音识别技术必将成为重点发展对象。

市场前景可观,而语音识别仍需突破

智能汽车

在CES 2017展会上,各大传统汽车制造商都带来了自己在自动驾驶汽车的最新成果。与此同时,在展会上,除了展示成果,不少厂商也宣布了自己的一系列计划,其中就包括在汽车中加入虚拟助手平台,以促进人车交互,进一步提升用户体验,比如日产、宝马与Cortana的合作,还有福特与Alexa的联手。

根据美国市场研究机构勒克斯的研究报告显示,自动驾驶汽车将在2030年创造价值870亿美元的市场。此外,另有研究显示,2030年全球范围将售出约1.2亿辆自动驾驶汽车。从数据来看,自动驾驶汽车的市场十分具有看头。

自动驾驶市场的推动下,人车交互也成了自动驾驶玩家的一个关注点,是汽车智能化的一部分。此外,相对于自动驾驶辅助技术,语音识别等交互技术的实现则容易得多,目前也已有不少车型搭载了语音识别技术。在智能汽车中,语音识别已经成为了一项基础的服务,而随着智能化时代的来临,人们对语音识别的要求也会进一步提升。

市场前景可观,而语音识别仍需突破

未来市场可观,而语音识别仍需“做事”

在新兴产业市场需求的推动下,语音识别的市场也是十分具有看头的,有研究机构指出,预计到2020年,全球语音识别的市场规模将从2015年的61.9亿美元增长到200亿美元。然而,在市场规模壮大这一美好的预测面前,我们也不能忽视一些需要面对的问题,只有解决了它们,语音识别才能得到完善,给用户带来极致服务。

市场前景可观,而语音识别仍需突破

首先就是对象识别的准确性。现在,在应用上,我们看见语音识别多是在智能家居领域,包括智能家电和服务机器人。此时,我们就要考虑一个问题了,当多个家庭成员同时讲话时,智能家电和服务机器人该执行谁的命令呢?它们又如何能在众声音中找出自己主人的命令?这些都是当前语音识别所需要解决的问题,毕竟我们通常所说的语音识别不仅仅只是单纯的对语音内容进行识别。

在这个问题上,人们也找到了一个解决方案——声纹识别。一般来讲,声纹具有唯一性,对说话人身份的确认有着极大的帮助。借助于声纹识别,语音识别能够准确对说话人的位置和身份进行定位,从而准确识别语音内容,执行其中下达的指令。不过,鉴于数据的极大空缺等问题,声纹识别技术还需完善。

市场前景可观,而语音识别仍需突破

其次是降低周边环境的干扰。对于人类来讲,在嘈杂环境中听别人说话或是从众多声音中找出自己想听的内容还是一件较为简单的事,而与此相反,这件事在机器这里并没有那么容易。

为了降低周边环境对语音识别的干扰,亚马逊和谷歌都在智能音箱中使用了麦克风阵列技术,从而起到一定的“降噪”作用,增加语音识别的准确率。不过,到目前为止,环境的干扰依然没有得到更好的解决,仍然是语音识别前进道路中的一只“拦路虎”,尤其是在多段语音中准确找出指定说话人的情境中。

市场前景可观,而语音识别仍需突破

在一次采访中,人工智能和机器学习权威学者、百度首席科学家吴恩达表示,2017年是“对话式电脑”快速发展的一年。对话式电脑,诸如聊天机器人、人工智能虚拟助手之类,作为展开对话的第一步,语音识别也属于这快速发展的一部分。

智能家居智能汽车等多种产业以及聊天机器人、虚拟助手这些产品市场的推动下,语音识别的市场正在不断扩大,同时也是对它准确性的一个挑战。

2016年,在语音识别内容的准确率上,各科技企业和团队都有了相应的突破,而在接下来的一年里,如何降低周边环境的干扰以及如何提高对声音的识别准确率将是语音识别所要解决的问题。


原文发布时间: 2017-01-16 18:23
本文作者: 韩璐
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
【10月更文挑战第17天】近日,谷歌、DeepMind等四大机构联合发布论文,展示大型语言模型(LLMs)在数学问题解决上的显著进步。通过引入元认知知识,研究人员开发了提示引导的交互程序,使LLMs能为数学问题分配合理技能标签并进行语义聚类。实验结果显示,GPT-4在GSM8K和MATH数据集上的准确性分别提升了11.6%和7.52%,展现出巨大潜力。这一成果不仅为AI领域提供了新思路,也为数学教育带来了启示。
57 4
|
9月前
|
人工智能 运维 搜索推荐
《百炼成金-大金融模型新篇章》––07.问题5:“杀手级通用大模型vs百花齐放专属大模型”,企业级AI应用的价值自证?
百炼必定成金,新质生产力会催生新质劳动力,谨以此文抛砖引玉,希望与业内的各位朋友一同探讨如何积极拥抱并运用大模型技术,以应对和驾驭不断变化的市场环境,实现科技金融持续稳定的提质增效和创新发展,携手开启金融大模型未来新篇章。
320 1
|
10月前
|
人工智能 编解码 算法
|
传感器 人工智能 搜索推荐
新兴AI技术与传统体育赛事的完美结合
随着近几年人工智能技术的不断发展,AI技术已经渗透到了各个领域,其中就包括体育赛事,尤其是在竞技领域,AI也已经开始积极参与,并在某些领域超越人类。通过AI技术能够帮助各种体育运动的参赛者、观众和组织者更好地发挥和管理其资源,从而推动体育赛事的发展和进步。恰逢第19届亚运会即将在杭州开幕,那么本文就来聊聊人工智能与体育竞技的结合探讨。
510 1
新兴AI技术与传统体育赛事的完美结合
|
机器学习/深度学习 人工智能 自然语言处理
AI大模型迈入应用时代,每日互动推动“可控大模型”落地
ChatGPT的推出引爆了一场波及全球科技领域的“AI飓风”,越来越多的企业入局大模型赛道,推动AI全面迈进应用时代。在2023数据安全发展大会上,每日互动创始人、CEO方毅谈及大模型,他表示,大模型的能力令人震撼,“吃”的是数据,“吐”的是智能。通过与行业知识结合,大模型能从海量的数据中提取出有价值的信息,为业务决策提供智能支持,但现阶段大模型缺乏对价值观的判断。在实际的业务场景中,垂直行业更需要“可控大模型”。
245 0
|
数据采集 人工智能 自动驾驶
借力算法,海天瑞声驾驭自动驾驶“新引擎”
2022 年的 3 月,或将被写入自动驾驶史册——美国颁布无人驾驶法规,中国也许将从政策层面允许 L3 自动驾驶乘用车上路,国内首条支持自动驾驶的快速路通车运营…… 毫无疑问,自动驾驶已经逐渐从快速迭代迈入大规模落地阶段。在这个 “临门一脚” 的关键时刻,想要让汽车本身的算法做到处理更多、更复杂的场景,不可或缺的是海量的场景数据支撑。通过对话国内唯一 A 股上市数据服务商—海天瑞声,透视 AI 数据在助推自动驾驶实现的路上,所面临的机会与挑战。
313 0
借力算法,海天瑞声驾驭自动驾驶“新引擎”
|
机器学习/深度学习 人工智能 算法
首家强化学习大规模落地工业应用,快手是如何做到的?
快手的日活跃用户数量超过三亿,其背后是业界领先的人工智能技术。
606 0
首家强化学习大规模落地工业应用,快手是如何做到的?
|
机器学习/深度学习 人工智能 算法
百度语音识别新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
今年 7 月,在开发者大会上,百度公布了其在 AI 技术上的进展。而短短四个月后,在昨日的百度语音能力引擎论坛上,百度在语音领域再次公开了最新的算法成果。同样引人关注的还有百度鸿鹄芯片的最新进展。
485 0
百度语音识别新算法准确率提升超30%,鸿鹄芯片彰显AI落地新打法
|
机器学习/深度学习 人工智能 算法
腾讯战略投资,燧原科技首款AI训练芯片出炉:性能超越V100
由腾讯领投、融资累计超过 6 亿元的 AI 芯片公司燧原科技,终于发布了自己的首款产品。
1078 0
腾讯战略投资,燧原科技首款AI训练芯片出炉:性能超越V100
|
人工智能 算法 Cloud Native
AI 进入工业化进程,百度要用这三大打法,加速智能革命
8 月 29 日,「ABC SUMMIT 2019 百度云智峰会」在北京国家会议中心举行。百度副总裁、智能云事业群组总经理尹世明一口气发布了 18 大智能计算新品及 7 大场景解决方案,讲述了 6 个典型客户案例,宣布成立了 1 个生态联盟。
277 0
AI 进入工业化进程,百度要用这三大打法,加速智能革命