modelscope-funasr官方发布的paraformer 在线版本(从零开始训练出来的版本),参数model_conf的ctc_weight是多少? 是0.0吗?
modelscope-funasr官方发布的Paraformer在线版本参数并非是0.0。具体来说,该模型被称为Paraformer-large长音频模型,这是一个集成了VAD(语音活动检测)、ASR(自动语音识别)、标点与时间戳功能的工业级模型。它可以直接对时长为数小时的音频进行识别,并输出带标点文字与时间戳。此外,这个模型在训练过程中采用了工业级数万小时的标注音频,因此具有很好的通用识别效果,可以广泛应用于语音输入法、语音导航、智能会议纪要等场景。
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352