modelscope-funasr、uniasr、paraformer,这三个是什么关系?
ModelScope-FunASR、UniASR和Paraformer都是与语音识别相关的模型。其中,ModelScope-FunASR是一个基于FUNASRTM的开源语音识别模型,该模型在10000小时的音视频数据上进行了微调,并且这个模型可以在ModelScope平台上找到,在这个平台上还开放了阿里工业级的语音识别模型,包括UniASR和Paraformer等不同的模型结构。
UniASR是一种基于Transformer的端到端语音识别模型。而Paraformer也是一种非自回归端到端语音识别模型,它采用了更深更大的模型结构,比如其Encoder有50层,包括memory equipped self-attention(SAN-M)和feed-forward networks (FFN),这使得它在处理大规模语音识别任务时具有更好的性能。
ModelScope、FunASR、UniASR 和 Paraformer 都与语音识别有关。具体来说:
ModelScope 是一个平台,提供了多种语音识别模型,包括阿里工业级的UniASR模型和Paraformer模型。此外,ModelScope还提供了其他预训练模型,如FunASR模型。
FunASR 是ModelScope上的一种语音识别模型。它是基于Transformer的端到端语音识别模型,支持多种语言和模型大小。
UniASR 是阿里达摩院推出的中文通用语音识别模型。它是一个基于深度学习的非自回归端到端语音识别框架,由Encoder、Predictor、Sampler、Decoder和Loss function五部分组成。
Paraformer 也是阿里达摩院推出的高效非自回归端到端语音识别框架。它同样由Encoder、Predictor、Sampler、Decoder和Loss function五部分组成,其中Encoder可以采用不同的网络结构,例如self-attention,conformer等。
funasr是开源项目,paraformer是其中一个开源模型,类似的还有bat模型等。此回答整理自钉群“modelscope-funasr社区交流”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352