modelscope-funasr这个模型在哪看限制输入数据的位宽呀?

modelscope-funasr speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online这个模型在哪看限制输入数据的位宽呀?经过降噪模型处理后的数据格式有点不一样,我想看看有没有什么限制(例如数据的位宽)

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:11 69 分享 版权
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    modelscope-funasr speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online模型的输入数据位宽,可以在该模型的主页中找到。在实际操作过程中,降噪处理后的数据格式可能会有所不同,但通常不会改变数据的位宽。如果有任何限制或要求,一般会在相关的文档或说明中明确指出。在使用任何模型前,建议您仔细阅读相关文档和指南以确保正确的数据处理和模型使用。

    2024-01-06 12:47:59
    赞同 展开评论
  • 关于ModelScope FunASR的speech_parformer-large_asr_nat-zh-cn-16k-common-vocab8404-online模型的限制输入数据的位宽,这通常可以在模型的文档中找到。然而,根据我的知识,ModelScope FunASR的官方文档中并没有明确提到这个模型的具体限制。

    一般来说,深度学习模型的输入数据位宽通常是固定的,例如32位浮点数(float32)或者16位浮点数(float16)。这是因为大多数深度学习框架(如PyTorch和TensorFlow)都支持这些数据类型。

    然而,如果你的数据经过降噪模型处理后,数据的格式发生了变化,这可能是因为降噪模型使用了不同的数据预处理方法。在这种情况下,你需要确保你的数据预处理方法与FunASR模型的预处理方法一致。

    2024-01-05 09:04:35
    赞同 展开评论
  • 最稳的:16000采样率,单通道,16位bit。不过,降噪后的wav去做asr,cer变差是正常现象。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-05 08:19:49
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

还有其他疑问?
咨询AI助理