开发者社区> 问答> 正文

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统?

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统?

展开
收起
圆葱猪肉包 2024-08-21 14:52:48 34 0
1 条回答
写回答
取消 提交回答
  • 达摩院语音实验室自研的 SAN-M 网络,打造了达摩院语音实验室新一代的端到端中英自由说语音识别系统。在不需要语种信息的前提下,用一个模型保证纯中文和纯英文相对于单语模型的识别性能基本不降,并且大幅度提升中英文混说场景下的识别性能。
    image.png

    考虑到方言种类比较多,每个专家网络通过简单的两层线性层来建模。进一步我们结合达摩院语音实验室自研的 SAN-M 网络,打造了达摩院语音实验室新一代的端到端方言自由说语音识别系统。在不需要提供方言id的情况下,用一个模型识别十四种常用方言,并且保证纯中文相对于单语模型的识别性能基本不降。
    image.png

    ——参考链接

    2024-08-31 07:43:38
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载