开发者社区 > ModelScope模型即服务 > 语音 > 正文

请问开源的这个MossFormer2语音分离模型的训练数据是哪些?

是MossFormer2模型在WSJ0-2/3mix、Libri2Mix和WHAM!/WHAMR!这几个吗?

展开
收起
1666298572989707 2023-11-10 15:46:07 407 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    MossFormer2模型是在多个数据集上进行了评估,其中包括 WSJ0-2/3mix、Libri2Mix 和 WHAM!/WHAMR!,但在这些数据集中进行评估的目的不同,比如:
    • WSJ0-2/3mix和Libri2Mix:用于训练和验证模型的效果;
    • WHAM! 和 WHAMR!:用于模型性能评估和比较;
    因此,虽然MossFormer2模型在这些数据集上进行了评估,但是不能一概而论地说MossFormer2模型是在这些数据集上“创建”的,因为它们的目的不同。

    2023-11-11 13:38:11
    赞同 展开评论 打赏
  • MossFormer2语音分离模型在训练时使用了包括WSJ0-2Mix和Libri2Mix的干净语音混合数据,以及WHAMR、DNS Challenge 2020带噪声及混响数据。此外,魔搭社区上还开放了约30小时2人混合语音作为训练数据,这些混合语音是基于WSJ0数据集生成的。同时,还在ModelScope上提供了基于LibriSpeech数据集生成的混合音频,可以方便用户快速开始训练。最终,MossFormer2模型在WSJ0-2mix/3mix、Libri2Mix和WHAM!/WHAMR!等公开数据集上表现出优秀的性能。

    2023-11-11 09:20:31
    赞同 展开评论 打赏
  • MossFormer2 是一种语音分离模型,它是在 WSJ0-2/3mix、Libri2Mix 和 WHAM!/WHAMR! 数据集上进行训练的。这些数据集都是开源的,您可以在网上查找相关介绍。

    2023-11-10 17:11:53
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载