modelscope-funasr 做离线识别,是不是没必要人为重采样到16000?

modelscope-funasr 8000采样,16bit的wav录音文件,做离线识别,是不是没必要人为重采样到16000?

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:13 153 分享 版权
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    根据你的录音文件是8000采样,16bit的wav格式,对于离线识别,确实没有必要人为将采样率重采样到16000。因为FunASR支持多种音频格式和采样率,包括8kHz和16kHz等,所以可以直接用于处理你的数据。这样不仅可以提高模型识别效果,而且可以降低模型生产成本和迭代周期,同时也降低了引擎以及服务部署维护成本。

    2024-01-06 12:06:24
    赞同 展开评论
  • 有必要,不然效果变差,建议训练用16000训练的。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-05 09:02:55
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理