人机交互新进展:LFR-DFSMN语音识别声学模型介绍
语音识别技术是人机交互技术的重要组成部分,而语音识别中的声学模型是语音识别技术中的核心所在,堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果,实现了语音识别的迭代速度、识别成本、服务质量的全面提升。
脱离现实场景去空谈“识别准确率”都是耍流氓
探究双11晚会上阿里云ET所变的魔术,涉及到数学、语音、图像等技术,数学支撑了扑克牌编码和“猜牌”的原理,语音支撑了主持人与ET的交流、图像支撑了对观众状态的跟踪和识别。来自阿里云智能语音技术专家与我们一起聊聊语音交互,听听他是如何看待智能语音技术,以及对语音识别领域的产业观察。
阿里全面进军IoT,语音将是人与IoT最自然的交互方式
鄢志杰在大会做主题发言
IoT:阿里巴巴新的主赛道
今天很高兴有这个机会能够来介绍一下我们自己的一些工作。为什么在一个人工智能的场合讲IoT,第一深圳是IoT产业非常活跃的城市;第二,同样是在深圳,阿里云在深圳的云栖大会上发布了新的战略,阿里巴巴将会全面进军IoT,IoT将成为阿里继电商、金融、物流、云计算之后一条全新的主赛道。