文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求？

modelscope-funasr的vad模型对输入的语音长度是不是有最短时长的要求？我发现对于太短的语音段，vad会识别错误（会将噪声当作语音），这些语音段是我从语音文件中截取的噪声，对原语音文件做asr，能正确识别，vad会忽略这些噪声点，应该是vad识别出了这些噪声给过滤掉了，但是单独截取出来一小部分噪声vad就会认为这是语音段，送入asr就会识别错误。

展开

收起

三分钟热度的鱼 2024-08-21 19:59:18 370 版权

0 条回答

写回答

取消提交回答

相关问答

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

455

0

0

modelscope-funasr的语音情感识别，如何离线部署？

313

0

0

modelscope-funasr有语音对话分离demo吗？

361

0

0

modelscope 的实时语音通话案例，有类似的方案吗？

263

1

0

modelscope-funasr的error in vad可能是什么原因啊？

372

1

0

modelscope-funasr够支持直接在automodel类使用附加vad模型的参数吗？

383

0

0

在modelscope-funasr为什么解析出来的文本跟语音差别很大？

252

0

0

为什么modelscope模型库里面chinese-hubert-base 页面是错误，是模型下架吗

322

0

0

您好我想问一下，在modelscope用OneKE模型去做知识图谱应该用re 还是ner 呀？

248

0

0

ModelScope 漏译是模型的问题吗？

218

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

AI数字人系统怎么落地：从内容生产流程看羲和·AI数字人系统的选型与试点

电话语音机器人实时打断怎么测？Barge-in延迟、误触发与状态恢复测试方法

AI 技术在英语教培行业的应用

【北京】贷款、教育行业外呼频繁被封？语音机器人的合规线路与话术配置方案

AIGC 广告素材审核实践：从垂类模型到多模态合规治理

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

Qwen Audio：打造专属 AI 语音助手

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

告别低效沟通，使用大模型发起语音通话

热门讨论

热门文章

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope的palm模型，对联生成模型训练的src_text通过什么算法确定？

使用魔搭swift对qwen-14b-chat-int8微调，官方脚本，报错

modelscope-funasr 热词如何设置？

如何修改通义千问的system prompt，以修改自定义名字

modelscope-funasr这个 whisper 对音频长度有限制么？

下载报错ssl认证失败

关于使用ModelScope离线启动已下载过的模型时遇到的问题

ZhipuAI/Multilingual-GLM-Summarization模型仅支持python2

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

Bamba-9B：基于 Mamba2 架构的仅解码语言模型，旨在提高大型语言模型在推理时的效率

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

ImBD：复旦联合华南理工推出 AI 内容检测模型，快速辨别文本内容是否为 AI 生成

Jina Reader：一键将网页内容转为适合 LLM 处理的文本格式，自动抓取和清洗网页内容，支持多种输出格式

展开全部

还有其他疑问?