modelscope-funasr离线转写包使用的是wfst解码,那模型自带的解码是不是就没用了?

modelscope-funasr离线转写包使用的是wfst解码,那模型自带的解码是不是就没用了?939537388e1b40eb642961f659e85efc.png

展开
收起
三分钟热度的鱼 2024-01-10 17:02:24 161 分享 版权
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    WFST解码是一种广泛使用的语音识别解码方法,其核心是在一张有向、带权、有环的图上进行广度遍历,搜索一条或多条最优路径。modelscope-funasr离线转写包使用的是WFST解码并不意味着模型自带的解码没有用了。实际上,两者可以结合使用,例如在解码过程中,可以先使用WFST解码找出所有可能的词序列,然后再使用模型自带的解码对词序列进行打分和筛选,从而得到更准确的结果。

    至于AM(Automatic Speech Recognition)训练,它是一种基于深度学习的语音识别方法,通常需要大量的标注数据进行训练。虽然WFST解码和模型自带的解码都是解码的一部分,但它们分别属于不同的阶段,因此在AM训练中仍然具有重要意义。通过优化WFST解码和模型自带的解码,可以提高语音识别系统的整体性能。

    生成n-gram是一种常见的定制模型的方法,它可以根据实际需求选择不同的n值。生成n-gram可以帮助模型更好地理解上下文信息,从而提高识别准确率。但需要注意的是,生成n-gram并不是唯一的定制方法,还可以通过调整模型参数、增加领域相关数据等方式对模型进行进一步定制。

    2024-01-13 13:35:18
    赞同 展开评论
  • FunASR离线转写包使用的是wfst解码,但这并不意味着模型自带的解码就没用了。实际上,两者可以并行存在并各自发挥其独特的作用。例如,wfst解码适用于实时语音转写,而模型自带的解码则可以用于其他场景,如批量处理等。

    关于AM训练,它是指自适应模型训练,通过这种方式可以根据实际应用场景对模型进行微调,使其更好地适应特定的任务或领域。即使使用了wfst解码,AM训练仍然具有意义,因为它可以帮助优化模型的性能和效果。

    至于生成ngram是否等同于定制,这需要视具体情况而定。ngram是一种基于统计的语言模型,它可以捕捉到文本中的上下文信息,从而改善语音识别的准确性。然而,如果需要针对特定任务或领域进行更深度的定制,可能需要采用更复杂的技术和方法。

    2024-01-12 09:57:10
    赞同 展开评论
  • 就是用WFST解码器代替了以前CTC解码器. wfst类似于佐料,am类似于主食,不是替代关系。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-10 17:31:22
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

还有其他疑问?
咨询AI助理