开发者社区 > ModelScope模型即服务 > 语音 > 正文

UniASR语音识别-缅甸语-通用-16k中的词表不对

UniASR语音识别-缅甸语-通用-16k,模型地址damo/speech_UniASR_asr_2pass-my-16k-common-vocab696-pytorch

其中config.yaml中的token list的词表不是缅甸语的词表

展开
收起
lovemefan 2023-03-21 16:21:18 677 0
2 条回答
写回答
取消 提交回答
  • 十分感谢,更新后的缅甸语词典为697,但是模型文件的embedding输入维度为878。也就是说模型pt和缅甸语识别模型仍然对不上。

    2023-03-22 20:50:50
    赞同 展开评论 打赏
  • config.yaml中的token list的词表已更新为缅甸语词表。

    2023-03-22 16:01:28
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
阿里云总监课第二期——IoT时代的语音交互智能 立即下载
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
智能语音交互:阿里巴巴的研究与实践 立即下载