能动嘴就别动手!研究表明语音识别的速度、正确率完胜键盘输入

简介:

别忘了语音识别还有一个硬伤:方言。

能动嘴就别动手!研究表明语音识别的速度、正确率完胜键盘输入

虽然语音识别技术的发展已经成为了目前人机交互方式的一大潮流,但事实上诸如苹果Siri以及微软Cortana等语音助手对很多人来说都非常鸡肋,比起使用这些智能语音识别软件,人们更依赖于敲击键盘表达诉求。而这在一定程度上也与人们对智能语音助手的传统印象有关,错误率高、识别速度慢成为了其最大硬伤。

但近来,研究人员的一项测试却表明:和人们手动键盘输入相比,语音识别反而能更快、更准确的组织文本消息。

来自美国斯坦福大学、华盛顿大学和中国百度的研究人员以iPhone为对象进行了一项“人机挑战赛”:一方为32名年龄介于19岁至32岁的打字高手,另一方则为百度硅谷人工智能实验室去年发布的“深度语音2”软件,双方分别以打字方式和语音方式录入了约100条日常短语。

有意思的是,这场比赛还是中英双语的。打字录入的一方中,半数实验对象以iPhone上的 QWERTY 键盘输入英文字母,而另一半实验对象则是借助苹果手机操作系统中所包含的汉语拼音输入法录入中文。

能动嘴就别动手!研究表明语音识别的速度、正确率完胜键盘输入

比赛最终的结果却让所有人都大跌眼镜:无论是中文还是英文,语音识别都要比键盘输入更加快速、更加正确,而且还是绝对优势胜出。

具体来看,英文录入时语音识别比打字快三倍,错误率低20.4%;中文录入时语音识别比打字快2.8倍,错误率则低了63.4%。

对于实验结果,研究人员也表示出了惊讶:“我们之前知道语音识别的效果还不错,预期的识别速度会比键盘打字快一些,但结果且让人惊讶,这一速度几乎快了3倍。”

据悉,研究人员此次实验的目的就是为了以定量的方式为语音识别技术“正名”,借以鼓舞工程师们更多地运用这项技术,来为更多应用软件开发语音操作界面。


原文发布时间: 2016-08-27 18:42
本文作者: 陈李
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
11月前
|
机器学习/深度学习 达摩院 前端开发
INTERSPEECH 2022论文解读|针对多方会议场景下说话人相关语音识别的对比研究
INTERSPEECH是由国际语音通讯协会 (International Speech Communication Association, ISCA) 创办的语音信号处理领域顶级旗舰国际会议。历届INTERSPEECH会议都备受全球各地语音语言领域人士的广泛关注。 ‍本文主要对比研究三种SA-ASR的方法,通过对说话人日志、语音分离和语音识别模块的耦合,在M2MeT竞赛上发布的真实会议场景语料库AliMeeting上进行了相关实验,有效地降低了说话人相关字错误率(SD-CER)。论文已被INTERSPEECH 2022接收。
320 0
|
机器学习/深度学习 传感器 算法
【语音识别】基于Morlet小波变换的滚动轴承故障特征提取研究附matlab代码
【语音识别】基于Morlet小波变换的滚动轴承故障特征提取研究附matlab代码
|
机器学习/深度学习 人工智能 自然语言处理
腾讯AI Lab副主任俞栋:语音识别研究的四大前沿方向
5 月 27-28 日,机器之心在北京顺利主办了第一届全球机器智能峰会(GMIS 2017),来自美国、加拿大、欧洲,香港及国内的众多顶级专家分享了精彩的主题演讲。在这篇文章中,机器之心整理了腾讯 AI Lab 副主任、西雅图人工智能研究室负责人俞栋在大会第一天发表了主题为《语音识别领域的前沿研究》的演讲,探讨分享了语音识别领域的 4 个前沿问题。
672 0
腾讯AI Lab副主任俞栋:语音识别研究的四大前沿方向
|
机器学习/深度学习 人工智能 自然语言处理
顶级语音专家、MSR首席研究员俞栋:语音识别的四大前沿研究
9 月中旬,微软报告了在语音识别方面取得的新里程碑:新系统的识别词错率降至 6.3%;一个月后,微软又公布了在这一领域成功实现了历史性突破:他们的语音识别系统实现了和专业转录员相当甚至更低的词错率(WER),达到了 5.9%!机器之心在此期间曾对微软首席语音科学家黄学东进行了专访,探讨了这一连串突破性背后的技术和语音识别领域未来的可能性。近日,机器之心又对微软研究院首席研究员俞栋进行了一次独家专访,谈论了深度学习与语音识别相辅相成的发展以及相关领域的现状和未来。
702 0
|
语音技术 Android开发
Android 轻“.NET研究”松实现语音识别
  苹果的iphone 有语音识别用的是Google 的技术,做为Google 力推的Android 自然会将其核心技术往Android 系统里面植入,并结合google 的云端技术将其发扬光大。   所以Google Voice Recognition在Android 的实现就变得极其轻松。
785 0
|
分布式计算 安全 大数据
9月5日云栖精选夜读:智能语音交互:阿里的研究和实践
云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲。本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出。
3617 0
|
机器学习/深度学习 自然语言处理 机器人
智能语音交互:阿里的研究和实践
云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲。本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出。
5123 0
|
API 语音技术 Python
Python 技术篇-百度语音识别API接口调用演示
Python 技术篇-百度语音识别API接口调用演示
378 0
Python 技术篇-百度语音识别API接口调用演示
|
1月前
|
机器学习/深度学习 自然语言处理 语音技术
语音识别技术的原理与应用
语音识别技术的原理与应用