备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr 是否支持把音频中没有说话的部分通过空白+时间段占位呢？

modelscope-funasr speech_paraformer-large-eres2net_large-vad-punc-spk_asr_nat-zh-cn 请问下，通过这个识别的句子，是否支持把音频中没有说话的部分通过空白+时间段占位呢？现在看识别的句子时长和音频文件的总时长是差不多的，音频中有空白的部分被分摊到各个句子的时间段中了。

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:27 147 版权

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

是的，ModelScope-FunASR支持将音频中没有说话的部分通过空白+时间段占位。在您提供的参数中，vad-punc表示使用语音活动检测（Voice Activity Detection）和标点符号分割（Punctuation Segmentation）来对音频进行分段。这意味着在识别过程中，系统会自动检测到音频中的静音部分，并将其用空白字符填充，同时保留标点符号。

因此，如果您的音频文件中有静音部分，那么在识别结果中，这些静音部分会被替换为空白字符，而不会占用句子的时间段。这样可以使识别结果更加准确，同时也方便后续的处理和分析。

2024-01-06 12:06:25

赞同展开评论

相关问答

在modelscope-funasr为什么识别的内容和音频不一致呀？

150

1

0

docker部署modelscope-funasr如何识别不同人说话？

362

0

0

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

201

0

0

modelscope-funasr 可以输入音频吗而不是文件？

166

1

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

265

0

0

modelscope-funasr的音频情感识别，用sensevoice好还是emotion2ve？

216

0

0

modelscope-funasr的这俩个模型在说话人之外的方面有差异点嘛？

222

0

0

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？

375

0

0

modelscope-funasr的多说话人语音识别模型支持实时听写吗？

246

0

0

在modelscope-funasr中请问vad模型是只能用16k采样率的音频吗？

162

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

在ModelScope中，下载模型时的ssl问题怎么解决？!

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

在ModelScope中，请问模型下载到本地的具体方法？

展开全部

Meta SAM3开源：让图像分割，听懂你的话

AgentEvolver：让智能体系统学会「自我进化」

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Z-Image：冲击体验上限的下一代图像生成模型

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Gemini 3 Nano Banana 的MCP服务器开发设计和国内直连方案

阿里云通义千问向全社会开放！

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

展开全部

还有其他疑问?