MossFormer2语音分离模型在训练时使用了包括WSJ0-2Mix和Libri2Mix的干净语音混合数据,以及WHAMR、DNS Challenge 2020带噪声及混响数据。此外,魔搭社区上还开放了约30小时2人混合语音作为训练数据,这些混合语音是基于WSJ0数据集生成的。同时,还在ModelScope上提供了基于LibriSpeech数据集生成的混合音频,可以方便用户快速开始训练。最终,MossFormer2模型在WSJ0-2mix/3mix、Libri2Mix和WHAM!/WHAMR!等公开数据集上表现出优秀的性能。