在CES 2017之后,语音识别成为了众人的关注焦点,而在市场规模扩大的背后,语音识别还不能完全满足人类的需求。
随着人工智能产品在生活中的渗透率越来越高,其中技术的发展也成为了众人关心的重点所在。作为人机自然交互的基本途径之一,近期以来,语音识别的发展不可谓不快速。
当下,诸如科大讯飞、百度等多家企业声称,其研发的语音识别技术已经达到了97%的准确率。而在日前,谷歌研究员公开表示其语音识别的错误率(将一个词语从语音转录成为文字时的错误率)自2012年以来已经降低了30%以上……纵观过去的2016年,谷歌、苹果和微软等多家科技巨头都公布了自己在语音识别上的进展和突破,而在接下来的时间里,语音识别也将是2017年的发展重点之一。
新兴产业市场广阔,推动语音识别技术发展
在刚刚过去不久的CES 2017展会上,我们见到了许多人工智能产品,要是来一场评比大赛,自动驾驶和智能家居绝对是主角。不过,再往深究,语音识别技术才是此次展会人工智能部分的“亮点”。
智能家居
在智能家居,不管是智能家电还是机器人,语音识别技术都是必备的基本功能之一。据知名市场调研公司《Markets And Markets》发布的调查报告称,全球智能家居市场规模将在2022年达到1220亿美元,2016-2022年年均增长率预测为14%。而在机器人方面,研究机构IDC预测,至2020年,全球机器人与相关服务市场规模将由2016年的915亿美元增至1880亿美元。从这两点数据来看,可想而知未来智能家居的市场之大。
在控制方式上,除了部分智能家电之外,语音控制已经成为了市场的主流,而这就是语音识别市场的商机。未来,作为人机自然交互的前提之一,语音识别必然是智能家居的发展趋势,只有语音识别的准确率接近完美,人机的自然交互才能继续开展。在智能家居市场的推动下,语音识别技术必将成为重点发展对象。
智能汽车
在CES 2017展会上,各大传统汽车制造商都带来了自己在自动驾驶汽车的最新成果。与此同时,在展会上,除了展示成果,不少厂商也宣布了自己的一系列计划,其中就包括在汽车中加入虚拟助手平台,以促进人车交互,进一步提升用户体验,比如日产、宝马与Cortana的合作,还有福特与Alexa的联手。
根据美国市场研究机构勒克斯的研究报告显示,自动驾驶汽车将在2030年创造价值870亿美元的市场。此外,另有研究显示,2030年全球范围将售出约1.2亿辆自动驾驶汽车。从数据来看,自动驾驶汽车的市场十分具有看头。
自动驾驶市场的推动下,人车交互也成了自动驾驶玩家的一个关注点,是汽车智能化的一部分。此外,相对于自动驾驶辅助技术,语音识别等交互技术的实现则容易得多,目前也已有不少车型搭载了语音识别技术。在智能汽车中,语音识别已经成为了一项基础的服务,而随着智能化时代的来临,人们对语音识别的要求也会进一步提升。
未来市场可观,而语音识别仍需“做事”
在新兴产业市场需求的推动下,语音识别的市场也是十分具有看头的,有研究机构指出,预计到2020年,全球语音识别的市场规模将从2015年的61.9亿美元增长到200亿美元。然而,在市场规模壮大这一美好的预测面前,我们也不能忽视一些需要面对的问题,只有解决了它们,语音识别才能得到完善,给用户带来极致服务。
首先就是对象识别的准确性。现在,在应用上,我们看见语音识别多是在智能家居领域,包括智能家电和服务机器人。此时,我们就要考虑一个问题了,当多个家庭成员同时讲话时,智能家电和服务机器人该执行谁的命令呢?它们又如何能在众声音中找出自己主人的命令?这些都是当前语音识别所需要解决的问题,毕竟我们通常所说的语音识别不仅仅只是单纯的对语音内容进行识别。
在这个问题上,人们也找到了一个解决方案——声纹识别。一般来讲,声纹具有唯一性,对说话人身份的确认有着极大的帮助。借助于声纹识别,语音识别能够准确对说话人的位置和身份进行定位,从而准确识别语音内容,执行其中下达的指令。不过,鉴于数据的极大空缺等问题,声纹识别技术还需完善。
其次是降低周边环境的干扰。对于人类来讲,在嘈杂环境中听别人说话或是从众多声音中找出自己想听的内容还是一件较为简单的事,而与此相反,这件事在机器这里并没有那么容易。
为了降低周边环境对语音识别的干扰,亚马逊和谷歌都在智能音箱中使用了麦克风阵列技术,从而起到一定的“降噪”作用,增加语音识别的准确率。不过,到目前为止,环境的干扰依然没有得到更好的解决,仍然是语音识别前进道路中的一只“拦路虎”,尤其是在多段语音中准确找出指定说话人的情境中。
在一次采访中,人工智能和机器学习权威学者、百度首席科学家吴恩达表示,2017年是“对话式电脑”快速发展的一年。对话式电脑,诸如聊天机器人、人工智能虚拟助手之类,作为展开对话的第一步,语音识别也属于这快速发展的一部分。
在智能家居、智能汽车等多种产业以及聊天机器人、虚拟助手这些产品市场的推动下,语音识别的市场正在不断扩大,同时也是对它准确性的一个挑战。
2016年,在语音识别内容的准确率上,各科技企业和团队都有了相应的突破,而在接下来的一年里,如何降低周边环境的干扰以及如何提高对声音的识别准确率将是语音识别所要解决的问题。