在modelscope-funasr我使用这个模型,对于短音频,性能很好,是不是需要换长音频模型?

在modelscope-funasr我使用speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx这个模型,对于短音频,性能很好,长音频,性能差太多了,跟音频时长不成比例,是不是需要换长音频模型?
34.6/1.4=24.7
909.2/202.0=4.5

展开
收起
三分钟热度的鱼 2024-01-17 18:46:38 79 分享 版权
1 条回答
写回答
取消 提交回答
  • 音频时长超过20s,就需要加vad模型了(长音频)。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-17 19:03:34
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理