> 来源 | HaaS技术社区
![image.png](https://ucc.alicdn.com/pic/developer-ecology/58b1420299b847e3ac46f4caf6de8788.png)
背景
近几年得益于人工智能在语音领域的突破,语音AI已经趋于成熟,尤其在智能音箱领域,智能音箱又带来了IoT应用到智能家居。
本文主要讨论从语音交互历史看它能否成为物联网新的爆点。
浅看语音交互的发展历史
时期一:词汇识别阶段
其实在20世纪50年代,就有了第一个单人语音数字识别系统,当时是贝尔实验室建立的。但是当时能识别的词汇量非常少,几乎无法商用,但是迈出了语音识别的先河。
到了20世纪六七十年代,技术发展的方向也仅仅是不断的扩展可识别的词汇,做的再好一点就是争取实现“连续语音”的识别。
时期二:交互式语音应答阶段
经过三十多年的发展后的20世纪80年代,语音技术的实用性进一步扩展到日常语音中。在这段时间就出现了交互式语音应答(Interactive Voice Response,IVR)系统,到了21世纪初IVR应用到了大量的地方,包括机票预订、银行转账、查询天气、收听交通信息等, 它可以通过电话线路理解人们的话,并执行相应的任务。
时期三:智能语音阶段
21世纪10年代,随着人工智能的突破,智能语音也出现了如雨后春笋般的蓬勃发展,如苹果的Siri、谷歌的Google Now、微软的Cortana智能语音交互类的App,以及天猫精灵、小爱同学、小度、Alexa、Google这类智能语音交互设备。并且目前用户的语音交互习惯也进一步发展,比如在Google报告中就指出了有20%的搜索是通过语音完成的。
从目前语音的发展历史上看,语音交互已经应用到了消费者生活的多个方面,并且在物联网领域尤其是智能家居领域应用非常成熟,所以笔者认为,目前对于智能语音技术在物联网其他领域也将逐渐发展起来。
语音应用的优势
再来看一下语音这种交互方式相对于传统的鼠标、触摸等有一些哪些优势呢?
主要有三个优势:交互速度、解放双手、触达容易。
(1)交互速度:在一些通用领域,使用语音转文本的方式输入文字,比打字快得多。甚至斯坦福研究表明即使对于专业打字员来说语音输入也很快。
(2)解放双手:在某些特殊的场景中,使用语音输入更加便捷,比如目前应用较多的驾驶助手、厨房做菜在不需要双手操作的情况下,能够进行一些交互甚至命令控制比打字更加的有效甚至安全。
(3)触达容易:对于一个不熟悉的东西,我们可以通过发问提出我们的需求,但是对于某些场景,比如操控某个设备的界面,如果看说明书或者研究使用方法,需要花费很多时间。但是如果能通过一句话来下发命令,就算是对于这个界面不熟悉的人,也能快速完成。
所以从这三个方面来看语音交互,在一些场景能够带来技术的影响,那么在物联网领域也有着大大小小各种类似的场景,需要语音去改变。
语音应用的当前现状
根据《2020智能语音产业生态及产业发展前景》把当前智能语音的产业链分为基础、技术、应用的三层。
上游基础层包括芯片、模组、传感器以及云计算服务和大数据平台等;
中游技术层主要提供语音识别、语音合成、深度/机器学习、人机交互等技术研究和服务;
下游应用包括智能手机、智能家居、智能汽车、可穿戴设备、虚拟助力、家庭机器人等B2C应用,以及金融、教育、医疗、安防等B2B应用。
从产业链的上中下三游可以看到,语音应用的技术基石已经很成熟,目前已经到了不断扩展应用场景的阶段,尤其在物联网行业在不断的渗透垂直领域,这也必将使智能语音在物联网行业得到蓬勃发展。
展望
无论从硬件还是软件目前智能语音交互的方式已经在很多垂直领域都开辟出了新的市场,未来也将扩展到更多的物联网市场,让这一步智能语音的革命带来更多的价值。