开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求?

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求?我发现对于太短的语音段,vad会识别错误(会将噪声当作语音),这些语音段是我从语音文件中截取的噪声,对原语音文件做asr,能正确识别,vad会忽略这些噪声点,应该是vad识别出了这些噪声给过滤掉了,但是单独截取出来一小部分噪声vad就会认为这是语音段,送入asr就会识别错误。

展开
收起
三分钟热度的鱼 2024-08-21 19:59:18 35 0
0 条回答
写回答
取消 提交回答

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

热门讨论

热门文章

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载