modelscope-funasr是不是没有同时支持输出时间戳和热词的长音频模型呀?

modelscope-funasr是不是没有同时支持输出时间戳和热词的长音频模型呀?

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:29 331 分享 版权
3 条回答
写回答
取消 提交回答
  • ModelScope-funasr的Paraformer-large长音频模型确实支持输出带标点的文字以及字级别的时间戳。该模型集成了VAD(语音活动检测)、ASR(自动语音识别)、标点与时间戳功能,因此能够直接对时长为数小时的音频进行识别。此外,它还支持基于ModelScope微调定制模型和batch级解码,能加快推理速度。虽然当前并未看到直接支持热词的功能,但这些特性可能会对您的需求有所帮助。同时,它也提供了多种输入音频方式,如wav.scp、音频bytes、音频采样点、WAV格式等。

    2024-01-09 11:58:24
    赞同 展开评论
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    是的,ModelScope-FunASR的长音频模型确实支持输出时间戳和热词。特别是Paraformer-large长音频模型,它集成了语音端点检测(VAD)、语音识别、标点以及时间戳功能,能够直接对时长为数小时的音频进行识别,并输出带标点的文字以及字级别的时间戳。同时,该模型还具有基于用户的热词列表增强记忆的功能,可以提升模型对热词的召回和精度。因此,对于您的需求,使用Paraformer-large长音频模型应该是一个不错的选择。

    2024-01-06 11:59:00
    赞同 展开评论
  • 没错,目前这种需求,只能用社区软件包哈(onnx)。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-05 08:27:34
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理