语音技术

首页 标签 语音技术
# 语音技术 #
关注
6660内容
如何搭建直播平台?低延时连麦+人工智能让互动升级
通过集成阿里云直播SDK,用户可以轻松实现移动端、PC端的直播流推送。直播服务器接收到直播流,对流进行处理(转封装、转码等),并通过CDN进行分发。支持10万+路流输出,1000万+观众同时在线。本文将详细展开。
阿里巴巴开源语音识别声学建模技术
本文我们介绍阿里巴巴的语音识别声学建模新技术: 前馈序列记忆神经网络(DFSMN)。目前基于DFSMN的语音识别系统已经在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。
基于阿里云API打造“Kim智能语音助理”
阿里云API应用创新大赛作品系列之-Kim智能语音音箱是如何基于阿里云API来实现开源的。
google sdk speech-to-text(谷歌语音转文本、谷歌语音转字幕)
).google sdk speech-to-text ).谷歌语音转文本 ).谷歌语音转字幕 ).谷歌从麦克风实时转字幕 ## 官网文档 - https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#...
INTERSPEECH 2017系列 | 语音识别技术之声学模型
编者:今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。
阿里云智能语音交互技术实践干货分享
阿里云技术总监/研发总监陈一宁博士通过直播分享了《阿里云智能语音交互技术实践》。他首先介绍了智能语音面临的技术挑战,然后对智能语音技术做了详细介绍。其中,他主要分享了阿里云使用的BLSTM & LFR声学模型的优化过程,并对基于深度学习的自然语言理解的不同场景进行了详细分享。
免费试用