语音技术

首页 标签 语音技术
# 语音技术 #
关注
6932内容
人工智能PK金牌速记员之实战录
引言 在2016年3月23日阿里云年会上,2000余名同学们见证了一场人机大战的好戏--阿里云iDST团队的实时语音识别系统在现场演讲分享环节实时挑战世界速记比赛亚军, 马总御用金牌速录师姜毅先生。这位神一般的速录师, 拥有超人的短时记忆功能, 超级的打字速度和惊人的正确率.要PK这样的对
DFSMN在阿里巴巴的应用以及如何采用开源代码训练DFSMN模型
DFSMN模型是语音识别中一种先进的声学模型,语音识别中的声学模型是语音识别技术中的核心所在。具体来说,声学模型是根据输入语音进行发音可能性的识别,结合语言模型、解码器,就构成了完整的语音识别系统。本次开源的DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、BLSTM等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。
INTERSPEECH 2017系列 | 语音唤醒技术
目前市场上推出了各式各样的音箱,机器人,车载等语音交互产品,语音识别是交互的入口,而语音唤醒成为了踏进这一入口的第一步,如何高效、准确地对用户指令给出反应成为这一技术的最重要目标。本主题将介绍语音唤醒技术的基础知识,基本技术架构以及INTERSPEECH2017上的最新研究成果。
《西部世界》何日来袭?自然语言理解是智能人机对话的关键瓶颈
人工智能如何具备理解用户和懂用户的能力?如何具备与用户自由对话的能力?如何实现主动和渐进式学习的能力……针对这一系列问题,云栖社区采访了阿里云iDST资深算法专家孙健(千诀),采访从人机对话交互中的自然语言理解和人机对话方向展开
有了人工智能加持,客户服务质检将是什么样?
  随着互联网信息技术在金融领域的应用程度越来越深,各企业在创新力度上的不断加强,市场竞争也在变得越来越激烈,在这种激烈的市场竞争中,客户服务已经越来越成为体现竞争差异、提升公司形象、增加客户满意度的重要举措,因此对客服体系服务质量的管理和控制已经变成了企业经营管理者日常的重要工作,而质检就是其中的主要组成部分。
人机交互新进展:LFR-DFSMN语音识别声学模型介绍
语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了语音识别的迭代速度、识别成本、服务质量的全面提升。
基于Tacotron汉语语音合成的开源实践
2017年初,Google 提出了一种新的端到端的语音合成系统——Tacotron。
INTERSPEECH 2017系列 | 远场语音识别技术
编者:今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。
脱离现实场景去空谈“识别准确率”都是耍流氓
探究双11晚会上阿里云ET所变的魔术,涉及到数学、语音、图像等技术,数学支撑了扑克牌编码和“猜牌”的原理,语音支撑了主持人与ET的交流、图像支撑了对观众状态的跟踪和识别。来自阿里云智能语音技术专家与我们一起聊聊语音交互,听听他是如何看待智能语音技术,以及对语音识别领域的产业观察。
免费试用