modelscope-funasr这个是什么情况?

23fe6eacc595450b2573ca64053a99af.png
modelscope-funasr这个是什么情况?UniASR语音识别-粤语简体-通用-16k-离线,这个测试识别的效果非常差啊

展开
收起
嘟嘟嘟嘟嘟嘟 2024-01-05 06:33:40 176 分享 版权
2 条回答
写回答
取消 提交回答
  • modelscope-funasr是一个基于FunASR的语音识别工具,它支持多种模型格式,包括ONNX。关于热词和时间戳的支持,您需要确保您的输入数据包含这些信息,并在推理过程中正确处理它们。

    在处理热词时,您可以将热词添加到文本中,或者使用特殊的标记来表示热词。例如,您可以使用<hotword>来表示热词。在推理过程中,您可以根据需要提取或忽略这些标记。

    对于时间戳,您可以将其作为额外的输入特征传递给模型。在推理过程中,您需要确保时间戳与音频数据对齐,并根据需要进行相应的处理。

    2024-01-05 09:32:35
    赞同 展开评论
  • 这个只能上传短音频,切分好以后的<15s的短音频。输入,wav格式,单通道音频,16000采样率。此回答整理自钉群“modelscope-funasr社区交流”

    2024-01-05 09:02:55
    赞同 展开评论

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

还有其他疑问?
咨询AI助理