JavaScript的语音识别-阿里云开发者社区

JavaScript的语音识别

2021-12-07 209

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： JavaScript的语音识别

有没有想过给您的网站增添语音识别的功能？比如您的用户不用点鼠标，仅仅通过电脑或者手机的麦克风发布命令，比如"下拉到页面底部”，或者“跳转到下一页”，您的网站就会执行对应命令。听起来很酷对么？然而为了实现这个功能，必须得让您网站的JavaScript脚本能够识别到这些语音输入。

这里介绍一个开源的JavaScript语言输入库，名叫annyang。

Github地址：https://github.com/TalAter/annyang

截至到2018年7月12日，这个github仓库已经有4833个Star了。

annyang实际上就是一个只有2KB大小的JavaScript脚本文件，使用起来非常方便。

下面就跟着我一起做一个Hello World应用吧，看看您通过麦克风说话的声音是如何被这个JavaScript库文件识别到的。

新建一个html文件，将下面的代码复制进去。将它部署到您本地的Tomcat或者nodejs服务器上。

我测试用的是Chrome。

当您第一次在浏览器里访问这个网页时，会弹出下面的Chrome对话框，提示您这个应用要使用您电脑上的麦克风。点Allow按钮即可。

这个应用有两个地方向您提示它可以接受语音输入。第一处是下图1的红色小圆圈。

第二处是一个小的麦克风图标，点击之后，可以设置允许或者禁止麦克风。我们当然是要选择允许啦，否则如何接受语音输入呢？

如果您的笔记本电脑本身也有麦克风，可以从这个下拉菜单里选择用笔记本自带的麦克风，还是用外接的麦克风。我用的是后者。

现在可以测试了。

因为代码里我给Hello这个语音绑定的执行函数是一个alert弹出对话框，所以当我对着麦克风说了一句“Hello"之后，我的浏览器立即弹出了这个对话框。

同样，说了"Bye"后，会弹出“再见”。我在响应“Bye”这个语音的函数设置了一个断点，大家通过调用栈也可以观察到annyang的处理逻辑。

从annyang的github上能看出，中文也在支持的语音之列，所以大家放心大胆地使用吧！

https://github.com/TalAter/annyang/blob/master/docs/FAQ.md

连粤语都支持，厉害了！

更多细节，请查阅annyang的官网。

https://www.talater.com/annyang/

相关实践学习

一键创建和部署高分电影推荐语音技能

本场景使用天猫精灵技能应用平台提供的技能模板，在2-5分钟内，创建一个好玩的高分电影推荐技能，使用模板后无须代码开发，系统自动配置意图、实体等，新手0基础也可体验创建技能的乐趣。

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

JavaScript的语音识别

汪子熙

热门文章

最新文章

相关课程

相关电子书