modelscope-funasr Paraformer语音识别-中文-通用-16k-离线-large 这个模型以后会支持角色分离吗?
目前,ModelScope-FunASR Paraformer语音识别模型主要应用在中文通用的16k离线场景下,并且模型规模为large。这个模型是由达摩院语音团队提出的非自回归端到端语音识别框架,采用工业级数万小时的标注音频进行训练,以确保模型具有较好的通用识别效果。此外,该模型支持魔搭社区开源的工业级的语音识别模型(Paraformer-large)的训练和微调,使得研究人员和开发者可以更加便捷地进行语音识别模型的研究和生产。
这种单功能的模型只为了做一件事,应该不会增加其它功能。像长音频识别这种组合的模型或转写包才有可能会增加其它附加功能。此回答整理自钉群“modelscope-funasr社区交流”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352