IEEE SLT 2022论文解读|基于多帧跨通道注意力机制的多说话人语音识别
近期,阿里巴巴达摩院高校AIR合作论文“MFCCA:Multi-frame cross-channel attention for multi-speaker ASR in multi-party meeting scenario”被IEEE SLT 2022接收。该论文考虑到麦克风阵列不同麦克风接收信号的差异,提出了一种多帧跨通道注意力机制,该方法对相邻帧之间的跨通道信息进行建模,以利用帧级和通道级信息的互补性。
达摩院技术创新全景|懂你的语音AI
过去十年,语音AI从实验室走向应用,语音搜索、交互早已融入日常。本文将带你一览达摩院语音AI技术创新全景,一起感受能听、会说、懂你的语音AI。
2022云栖内容精选—AI助力新型电力系统建设
摘要:本文整理自达摩院决策智能实验室负责人印卧涛,在云栖大会的分享。本篇内容主要分为三个部分:
1. “双碳”目标下的新型电力系统与挑战
2. 在电力预测、调度决策、虚拟电厂决策方向的创新与积累
3. 关于未来的产品展望