微软的一个研究团队在开发语音识别技术方面取得了新成果,在语音识别准确率上面超过了IBM的超级电脑沃森。微软将其语音识别技术的出错率降到了6.3%,打破了沃森之前保持的6.9%的出错率纪录。
微软的目标是让计算机能够理解语言以及人的意图,从而帮助它改进Cortana、Skype Translator和其他跟语言有关的服务。它在语音识别技术准确性上的突破让它朝着这个目标又迈进了一步。
语音将成为一种主流计算界面。数字化语音助手比如苹果的Siri已经成为移动设备生态系统的一个组成部分,但是这项技术的执行速度仍然较慢,而且出错率比较高。现在,搜索功能和语言理解方面的技术研发取得了一些突破性成果,极大地提高了语音助手的准确率和便利性。
为了在这场技术革命中处于领先的位置,很多技术公司包括亚马逊、苹果、谷歌和IBM都已经开始面向消费者提供语音识别技术。例如,苹果在Siri中添加了第三方整合功能,允许它与第三方应用通讯。这意味着用户们将可以利用Siri服务呼叫Uber专车。
然而,要想成为消费者最主要的计算平台,语音助手仍需进一步改进和完善。据凯鹏华盈分析师玛丽·米克尔(Mary Meeker)称,语音识别的准确率必须达到99%左右(现在大约是90%),语音指令才能成为最有效的计算输入形式。
与此同时,还没有或者不打算投资语音技术的公司可能必须承担被竞争对手甩在身后的风险。Facebook的Messenger副总裁大卫·马科斯(David Marcus)最近在TechCrunch Disrupt大会上接受采访时重申了这一点。马科斯承认,Facebook目前仍把重点放在文本上面,这可能会让它无缘参与语音识别技术领域的竞争。
本文转自d1net(转载)