在modelscope-funasr我使用speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx这个模型,对于短音频,性能很好,长音频,性能差太多了,跟音频时长不成比例,是不是需要换长音频模型?
34.6/1.4=24.7
909.2/202.0=4.5
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352