是MossFormer2模型在WSJ0-2/3mix、Libri2Mix和WHAM!/WHAMR!这几个吗?
MossFormer2模型是在多个数据集上进行了评估,其中包括 WSJ0-2/3mix、Libri2Mix 和 WHAM!/WHAMR!,但在这些数据集中进行评估的目的不同,比如:
• WSJ0-2/3mix和Libri2Mix:用于训练和验证模型的效果;
• WHAM! 和 WHAMR!:用于模型性能评估和比较;
因此,虽然MossFormer2模型在这些数据集上进行了评估,但是不能一概而论地说MossFormer2模型是在这些数据集上“创建”的,因为它们的目的不同。
MossFormer2语音分离模型在训练时使用了包括WSJ0-2Mix和Libri2Mix的干净语音混合数据,以及WHAMR、DNS Challenge 2020带噪声及混响数据。此外,魔搭社区上还开放了约30小时2人混合语音作为训练数据,这些混合语音是基于WSJ0数据集生成的。同时,还在ModelScope上提供了基于LibriSpeech数据集生成的混合音频,可以方便用户快速开始训练。最终,MossFormer2模型在WSJ0-2mix/3mix、Libri2Mix和WHAM!/WHAMR!等公开数据集上表现出优秀的性能。
MossFormer2 是一种语音分离模型,它是在 WSJ0-2/3mix、Libri2Mix 和 WHAM!/WHAMR! 数据集上进行训练的。这些数据集都是开源的,您可以在网上查找相关介绍。