modelscope-funasr能不能在官网上专门放一个模型介绍的,每个模型有什么特点和缺点,哪些可以组合,现在模型挺多看着有点乱。
ModelScope-FunASR框架确实提供了多种语音识别模型,包括但不限于Paraformer、UniModelScope-FunASR框架确实提供了多种语音识别模型,包括但不限于Paraformer、UniASR、Conformer、RNN-T、MCFCA等。这些模型各有其特点和适用场景:
Paraformer模型:这是达摩院语音团队提出的一种高效的非自回归端到端语音识别框架,采用工业级数万小时的标注音频进行模型训练,保证了模型的通用识别效果。它可以应用于语音输入法、语音导航、智能会议纪要等场景。
MFCCA多说话人语音识别模型:这个模型主要解决会议场景下多说话人语音识别的问题,基于ICASSP2022 M2MeT竞赛发布的真实会议场景语料库AliMeeting进行训练,在AliMeeting上实现了目前最新的SOTA性能。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352