开发者社区> 行者武松> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

在终端设备上实现语音识别:ARM开源了TensorFlow预训练模型

简介:
+关注继续查看
本文来自AI新媒体量子位(QbitAI)

关键词识别(Keyword Spotting,KWS)是语音识别领域的一个子领域,在用户在智能设备上进行语音交互时起到重要作用。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 关键词识别pipeline

近日,ARM和斯坦福大学合作开源了预训练TensorFlow模型和它们的语音关键词识别代码,并将结果发表在论文Hello Edge: Keyword Spotting on Microcontrollers中。

这个开源库包含了TensorFlow模型和在论文中用到的训练脚本。

在论文中,研究人员还展示了不同的神经网络架构,包含DNN、CNN、Basic LSTM、LSTM、GRU、CRNN和DS-CNN,并将这些架构加入到预训练模型中。

预训练模型地址:

https://github.com/ARM-software/ML-KWS-for-MCU/tree/master/Pretrained_models

论文摘要

在研究中,研究人员评估了神经网络架构,并且在资源受限的微控制器上运行KWS。他们训练了多种神经网络架构变体,并比较变体之间的准确性和存储/计算需求。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

 神经网络模型的准确性

研究人员发现,在不损失精确度的情况下,在存储了计算资源受限的微控制器上优化这些神经网络架构可行。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

之后,研究人员还进一步探索了DS-CNN架构,并且和其他神经网络架构进行了对比。

结果证明,DS-CNN架构的准确性最高,为95.4%,比超参数相似的DNN模型精确度约高10%。

640?wx_fmt=png&wxfrom=5&wx_lazy=1
 超参数搜索中的最佳神经网络

相关资料

论文下载地址:

https://arxiv.org/pdf/1711.07128.pdf

项目代码地址:

https://github.com/ARM-software/ML-KWS-for-MCU

本文作者:林鳞 
原文发布时间:2017-12-14 

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
语音识别技术|学习笔记
快速学习语音识别技术
15 0
Tensorflow Serving部署模型与调用
本文以mnist为数据集,使用keras 构建CNN网络,将训练获取的模型通过Tensorflow Serving方式部署提供Rest Full接口,分别使用PostMan和Python调用服务,代码编辑调试使用阿里云PAI DSW实例,模型部署使用阿里云ECS虚拟机。
6456 0
独家 | 在浏览器中使用TensorFlow.js和Python构建机器学习模型(附代码)
本文首先介绍了TensorFlow.js的重要性及其组件,并介绍使用其在浏览器中构建机器学习模型的方法。然后,构建使用计算机的网络摄像头检测身体姿势的应用程序。
2534 0
阿里开源新一代自研语音识别模型DFSMN,准确率达96.04%
近日,阿里巴巴达摩院机器智能实验室推出了新一代语音识别模型DFSMN,将全球语音识别准确率纪录提高至96.04%(这一数据测试基于世界最大的免费语音识别数据库LibriSpeech)。
2040 0
福音:不懂代码也能用TensorFlow做验证码识别了
长话短说,开门见山,网络上现有的代码以教学研究为主,对于验证码识别有刚需的朋友们,无需阅读代码,几个参数任何人都能使用机器学习技术训练一个模型,如本文有不严谨之处还请告知与谅解,此文旨在献给不求甚解,拿来主义者。
3618 0
Tensorflow 迁移学习 识别中国军网、中国军视网Logo水印
Tensorflow 目标检测项目 图片logo水印识别。识别中国军网、中国军视网Logo水印。 image image Step 0 下载项目 git clone https://github.com/tensorflow/models/tree/master/research/object_detection Step 1 在将项目目录添加到PYTHONPATH 作者bourdakos1整合了tensorflow中的object-detection和slim两个子项目。
1490 0
机器换人!浙江高院庭审引入语音识别技术!
浙江高院庭审引入语音识别技术,这是国内首例由人工智能程序替代书记员完成庭审笔录的案件,这款程序来自阿里云,被称为小Ai。随后,西湖法院又对一起盗窃案试用了小Ai,准确率高达96.2%。
4194 0
+关注
行者武松
杀人者,打虎武松也。
文章
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
深度学习框架实战-Tensorflow
立即下载
线性加速Tensorflow分布式计算
立即下载
通用多模态AI构建
立即下载