人机大战机器胜！这次是智能语音识别技术！-阿里云开发者社区

人机大战机器胜！这次是智能语音识别技术！

2016-03-09 8615

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 昨日，阿里云iDST的语音识别系统与世界上最快的男人进行了一场真枪实弹的比拼。云栖社区第一时间为大家揭秘背后的语音识别技术。语音识别技术是人工智能领域极为重要的前沿技术，目前，阿里云iDST团队的语音识别技术已经在蚂蚁金服智能客服等领域开始了商业上的运用。

昨天，在阿里云的一场年会上，真枪实弹的上演了一场人机大战。一张大屏分两边，一边实时滚动的是出自阿里著名的快男姜毅的文字速记，一边出现的是阿里云iDST的科学家们在短短一年时间打造出来的语音识别系统支持下的语音转文本记录。

人机大战一触即发，随着阿里云总裁胡晓明的演讲展开，屏幕两端实时出现了各自的文本记录，从现场效果来看，难分伯仲。如果不是提前告知，观者很难感知到擂台的一端是机器人，因为可以实时的看到机器人除了记录之外，还能根据演讲人语境的变化，返回来对前面的记录进行调整。

结果评估取孙权前八分钟的演讲录音，对比机器人和姜毅出现多字，少字以及错字的情况，出错少的一方获胜。机器人出现了一些词汇错误，而姜毅的正确率从头到尾非常高，但因为漏打了几个字，错失了机会。经过半个小时人工核对结果，机器人以微弱优势险胜姜毅。值得一提的是，前不久，在匈牙利举办的第50届国际速记大赛上，姜毅代表中国队，在文本看打速记比赛项目中以300字/分钟的文字速记速度，勇夺世界亚军。纵然是微弱的优势，但这次机器人战胜的已经是世界级的水平。

2c344edd0ad7359741957e89b2fa7d681d983518

虽然是第一次正式亮相，但从去年开始iDST的语音识别系统，已经在阿里巴巴的多个业务场景中应用了。从去年开始，阿里集团与蚂蚁客服每接听一个电话，都会立刻启动一个叫风语者的系统，它就是自动语音识别技术，将语音转变成文字，千分之三的人工抽检可以瞬间升级为100%的自动质检。除此应用场景之外，阿里YunOS、阿里小蜜以及手淘，现在都已经应用到阿里云的语音识别系统。

云栖社区邀请到此次深度参与“人机大战”语音识别项目的阿里云iDST技术总监鄢志杰（智捷），他将和大家分享阿里语音识别技术目前的一些应用，背后的技术难点以及一些重点的技术沉淀。针对项目背后的一些核心技术关键点，例如：基于GPU的快速并行， BLSTM，超大规模语言模型，基于GPU的快速解码等，我们已经邀请到相关技术专家并约稿，会请他们来跟大家分享。请持续关注！

【技术解读】

语音识别助力客服小二：集团语音识别技术在留声机、服务宝项目中的应用 by 智捷

【扩展阅读】

95188：BLSTM-DNN hybrid语音识别声学模型的第一个工业应用

阿里小蜜：语音识别、语义分析、深度学习在手机淘宝的实战分享

自然语言理解（Natural Language Understanding）

语音合成在语音助手中的应用及扩展

特定人语音唤醒简介

数据驱动的多策略聊天引擎

GPU训练的快速大规模分布式扩展-GPU多机多卡Machine Learning Middleware

8c3c57d79a3c96f0945d360c837bfe4ff42d9d79

持续更新，敬请关注哦！

相关实践学习

一键创建和部署高分电影推荐语音技能

本场景使用天猫精灵技能应用平台提供的技能模板，在2-5分钟内，创建一个好玩的高分电影推荐技能，使用模板后无须代码开发，系统自动配置意图、实体等，新手0基础也可体验创建技能的乐趣。

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

人机大战机器胜！这次是智能语音识别技术！

热门文章

最新文章

相关课程

相关电子书

相关实验场景