JavaScript的语音识别

简介: JavaScript的语音识别

有没有想过给您的网站增添语音识别的功能?比如您的用户不用点鼠标,仅仅通过电脑或者手机的麦克风发布命令,比如"下拉到页面底部”,或者“跳转到下一页”,您的网站就会执行对应命令。听起来很酷对么?然而为了实现这个功能,必须得让您网站的JavaScript脚本能够识别到这些语音输入。


image.png


这里介绍一个开源的JavaScript语言输入库,名叫annyang。


Github地址:https://github.com/TalAter/annyang


截至到2018年7月12日,这个github仓库已经有4833个Star了。


image.png


annyang实际上就是一个只有2KB大小的JavaScript脚本文件,使用起来非常方便。


下面就跟着我一起做一个Hello World应用吧,看看您通过麦克风说话的声音是如何被这个JavaScript库文件识别到的。


新建一个html文件,将下面的代码复制进去。将它部署到您本地的Tomcat或者nodejs服务器上。


image.pngimage.png

我测试用的是Chrome。


当您第一次在浏览器里访问这个网页时,会弹出下面的Chrome对话框,提示您这个应用要使用您电脑上的麦克风。点Allow按钮即可。


image.png


这个应用有两个地方向您提示它可以接受语音输入。第一处是下图1的红色小圆圈。


image.png


第二处是一个小的麦克风图标,点击之后,可以设置允许或者禁止麦克风。我们当然是要选择允许啦,否则如何接受语音输入呢?


image.png


如果您的笔记本电脑本身也有麦克风,可以从这个下拉菜单里选择用笔记本自带的麦克风,还是用外接的麦克风。我用的是后者。


image.png


现在可以测试了。

image.png



因为代码里我给Hello这个语音绑定的执行函数是一个alert弹出对话框,所以当我对着麦克风说了一句“Hello"之后,我的浏览器立即弹出了这个对话框。


image.png


同样,说了"Bye"后,会弹出“再见”。我在响应“Bye”这个语音的函数设置了一个断点,大家通过调用栈也可以观察到annyang的处理逻辑。


image.png


从annyang的github上能看出,中文也在支持的语音之列,所以大家放心大胆地使用吧!


https://github.com/TalAter/annyang/blob/master/docs/FAQ.md


连粤语都支持,厉害了!


image.png


更多细节,请查阅annyang的官网。


https://www.talater.com/annyang/


image.png

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
8月前
|
JavaScript 前端开发 CDN
JavaScript 实现 3D 模型
JavaScript 实现 3D 模型
|
11月前
|
机器学习/深度学习 存储 前端开发
《智能前端技术与实践》——第 2 章 前端开发基础 ——2.6 深度学习中的 JavaScript——2.6.1 JavaScript数据类型
《智能前端技术与实践》——第 2 章 前端开发基础 ——2.6 深度学习中的 JavaScript——2.6.1 JavaScript数据类型
|
11月前
|
机器学习/深度学习 前端开发 JavaScript
《智能前端技术与实践》——第 2 章 前端开发基础 ——2.6 深度学习中的 JavaScript——2.6.2 JavaScript数据类型(下)
《智能前端技术与实践》——第 2 章 前端开发基础 ——2.6 深度学习中的 JavaScript——2.6.2 JavaScript 异步编程(下)
|
11月前
|
JavaScript 前端开发 Java
《从案例中学习JavaScript》之实现对话效果(一)
今天突发奇想,js能不能通过字符串和定时器来实现游戏中的对话效果呢。试了一下,还真挺好玩的。 上效果图:
|
11月前
|
移动开发 编解码 前端开发
《从案例中学习JavaScript》之实现对话效果(二)
《从案例中学习JavaScript》之实现对话效果(二)
|
算法 JavaScript 搜索推荐
|
JavaScript 前端开发 应用服务中间件
JavaScript的语音识别
JavaScript的语音识别
135 0
JavaScript的语音识别
|
JavaScript 前端开发 安全
前端必知词汇:JavaScript
JavaScript (JS) 是一种具有函数优先的轻量级,解释型或即时编译型的编程语言。JavaScript是一种属于网络的脚本语言, 已经被广泛用于Web应用开发,常用来为网页添加各式各样的动态功能,为用户提供更流畅美观的浏览效果。通常JavaScript脚本是通过嵌入在HTML中来实现自身的功能的。
455 0
|
传感器 JavaScript 前端开发

热门文章

最新文章