modelscope-funasr这个是什么情况?UniASR语音识别-粤语简体-通用-16k-离线,这个测试识别的效果非常差啊
modelscope-funasr
是一个基于FunASR
的语音识别工具,它支持多种模型格式,包括ONNX。关于热词和时间戳的支持,您需要确保您的输入数据包含这些信息,并在推理过程中正确处理它们。
在处理热词时,您可以将热词添加到文本中,或者使用特殊的标记来表示热词。例如,您可以使用<hotword>
来表示热词。在推理过程中,您可以根据需要提取或忽略这些标记。
对于时间戳,您可以将其作为额外的输入特征传递给模型。在推理过程中,您需要确保时间戳与音频数据对齐,并根据需要进行相应的处理。
这个只能上传短音频,切分好以后的<15s的短音频。输入,wav格式,单通道音频,16000采样率。此回答整理自钉群“modelscope-funasr社区交流”
ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352