modelscope-funasr是否可以得到对应字,或者词的时间戳?

modelscope-funasr是否可以得到对应字,或者词的时间戳?

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:11 400 分享 版权
2 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    是的,modelscope-funasr能够提供对应字或词的时间戳。特别是,它可以通过参数量较小的encoder与反卷积predictor实现时间戳预测,其时间戳准确率与kaldi force-alignment系统相当。此外,也有集成了VAD、ASR、标点与时间戳功能的Paraformer-large长音频模型,这种模型能够直接对时长为数小时的音频进行识别,并输出带标点文字与时间戳。

    2024-01-06 12:45:57
    赞同 展开评论
  • 是的,modelscope-funasr不仅可以进行语音转文字,还能同时输出对应字或词的时间戳。这通过其时间戳预测功能实现,该功能的准确率与kaldi force-alignment系统相当。另外,对于长音频版本的Paraformer-large模型,它还能够集成VAD(Voice Activity Detection)、ASR(Automatic Speech Recognition)、标点与时间戳功能,这意味着它可以对时长为数小时的音频进行识别,并输出带有标点的文字与时间戳。

    2024-01-05 09:04:33
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理