文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr的vad的max_end_silence_time参数怎么使用呢？

modelscope-funasr的vad的max_end_silence_time参数怎么使用呢？我加上没有效果，是不是加的方式不对呢？ https://github.com/alibaba-damo-academy/FunASR/issues/1487

展开

收起

三分钟热度的鱼 2024-03-20 15:45:08 841 版权

3 条回答

写回答

取消提交回答

请看我回答~

阿里云大降价~
max_end_silence_time 参数在 ModelScope-Funasr 的语音活动检测（VAD）模块中用于控制识别结束时的最长静音时间。这个参数指定了在音频流结束前，允许的最大连续静音时长。如果在这个时间内没有检测到任何语音活动，则认为语音已经结束，识别过程将停止。

如果您发现设置 max_end_silence_time 没有效果，可能是由于以下几个原因：
1. 参数值不合适：检查您设置的 max_end_silence_time 是否合理。如果设置得过短，可能导致提前截断语音；如果设置得过长，可能导致在语音结束后仍有较长时间才停止识别。
2. 环境噪音：如果背景噪声水平较高，可能导致 VAD 无法准确检测到语音结束。尝试在更安静的环境中录音或调整 VAD 的灵敏度设置。
3. 配置未正确应用：确保您修改的配置文件被正确加载和应用。有时可能因为配置文件没有更新或者服务没有重启而导致配置未生效。
4. 代码问题：检查您的代码是否有错误，或者是否正确调用了相应的 API 和设置了参数。
5. 模型版本：确保您使用的 Funasr 版本支持 max_end_silence_time 参数。如果是旧版本，可能需要更新到支持该参数的版本。
6. 日志和监控：查看系统的日志和监控信息，以确定是否有其他错误或警告信息，这可能有助于诊断问题。
如果上述方法都无法解决问题，建议参考 Funasr 的文档或者在 GitHub 上提交 issue，寻求开发者的帮助。同时，您也可以查看已有的 issue #1487，看看是否有其他用户遇到了类似的问题以及解决方案。
2024-03-27 19:27:00

赞同展开评论
小Lee

max_end_silence_time参数用于设置语音识别中的静音段的最大持续时间。如果你在FunASR中设置了该参数但没有生效，可能是因为参数设置不正确或者与其他参数冲突。建议检查参数设置并确保其正确性。

2024-03-20 16:24:46

赞同展开评论
圆不溜秋的小猫猫

这个代码里面加好像确实没用，我都是在config.yaml里面直接改的。直接改你加载的那个checkpoint路径的配置。此回答整理自钉群“modelscope-funasr社区交流”

2024-03-20 15:56:48

赞同展开评论

相关问答

modelscope这个报错呢怎么回事？在参数里加上encoding=utf-8，又会出现这个报错

265

1

0

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求？

341

0

0

modelscope-funasr的error in vad可能是什么原因啊？

331

1

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

342

0

0

modelscope-funasr20ms的情况下vad参数是如何设置的？

283

0

0

modelscope-funasr设置这个单位长度是什么参数？

503

1

0

modelscope-funasr的VAD算法报错，如何处理？

385

0

0

在modelscope-funasr中请问vad模型是只能用16k采样率的音频吗？

260

0

0

在modelscope-funasr中如果isfinal传false那vad返回的全是完整语音段吗？

218

0

0

在modelscope-funasr中如何通过vad判断最后一段语音的结束点位置？

289

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

一句话查高铁票并写入文件：揭秘 IntentOrch 的意图驱动编排黑科技

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

热门讨论

热门文章

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr这个报错怎么处理？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr 热词如何设置？

如何修改通义千问的system prompt，以修改自定义名字

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

下载报错ssl认证失败

modelscope-funasr解析出来的角色人对话不全，是哪里参数没设置对吗？

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

展开全部

还有其他疑问?