语音技术

首页 标签 语音技术
# 语音技术 #
关注
6544内容
数据集大全:25个深度学习的开放数据集
还在发愁找不到数据集训练你的模型?快来收藏一下史上最全的深度学习数据集汇总吧,有它在,一切都ok~
能帮你更好理解分析深度卷积神经网络,今天要解读的是一款新型可视化工具——CNNVis,看完就能用!
深度卷积神经网络(CNNs)在许多模式识别任务中取得了很大的性能突破, 然而高质量深度模型的发展依赖于大量的尝试,这是由于没有很好的理解深度模型是怎么工作的,在本文中,提出了一个可视化分析系统CNNVis,帮助机器学习专家更好的理解、分析、设计深度卷积神经网络。
深度学习训练,选择P100就对了
本文使用NVCaffe、MXNet、TensorFlow三个主流开源深度学习框架对P100和P40做了图像分类场景的卷积神经网络模型训练的性能对比,并给出了详细分析,结论是P100比P40更适合深度学习训练场景。
如何搭建直播平台?低延时连麦+人工智能让互动升级
通过集成阿里云直播SDK,用户可以轻松实现移动端、PC端的直播流推送。直播服务器接收到直播流,对流进行处理(转封装、转码等),并通过CDN进行分发。支持10万+路流输出,1000万+观众同时在线。本文将详细展开。
阿里云RPA(机器人流程自动化)干货系列之二:认识RPA(下)
导读:本文是阿里云RPA(机器人流程自动化)干货系列之二,主要介绍了RPA的发展齐纳经和主要使用场景有哪些,目前国内外主流的RPA厂商以及RPA的未来在哪。 一、RPA的发展前景 根据Gartner的最新研究,2018年全球机器人流程自动化(RPA)软件的开支预计将达到6.8亿美元,同比增长57%,到2022年支出达到24亿美元。
特定人语音唤醒简介
特定人语音唤醒,就是通过识别语音中所含的内容和人的身份信息,来实现特定人语音唤醒功能。这是一种较为新颖、具有一定安全性、便捷性和趣味性的功能,同时可以增强个性化体验。
基于阿里云API打造“Kim智能语音助理”
阿里云API应用创新大赛作品系列之-Kim智能语音音箱是如何基于阿里云API来实现开源的。
google sdk speech-to-text(谷歌语音转文本、谷歌语音转字幕)
).google sdk speech-to-text ).谷歌语音转文本 ).谷歌语音转字幕 ).谷歌从麦克风实时转字幕 ## 官网文档 - https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#...
免费试用