备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr问题请教下？

modelscope-funasr问题请教下：我看infer的代码参数是可以传时间戳模型的，有没有现在的时间戳模型和对应的config，我想要用speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch 组合时间戳模型，能够在推理的时候输入类似于speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorch这个模型的sentences的数据出来，应该怎么操作？另外我不需要paraformer-large-vad-punc输出的text,text_postprocessed,time_stamp的内容只需要sentences的这个数据

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 06:13:31 155 版权

1 条回答

写回答

取消提交回答

番茄酱脑袋

独立的时间戳模型在这里
https://modelscope.cn/models/damo/speech_timestamp_prediction-v1-16k-offline/summary
但是只有长音频版也就是paraformer-large-vad-punc这个模型在infer的过程中会生成sentence字段，并且这个模型的时间戳预测是随着asr的预测一起产生的，比先asr再预测时间戳更准确。我看你的需求应该是用长音频版模型就可以了。需要finetune的asr模型是一样的，长音频版模型只是在pipeline级别集成了外部的vad和punc，模型上给predictor部分添加了一个cif头，不会有速度变慢的问题。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-05 08:27:34

赞同展开评论

相关问答

请问下我访问接口不通什么原因 Provisional headers are shown

3443

0

0

购买阿里国外的云服务器是否可以访问谷歌？

83206

47

0

sql server的用户名和密码怎么查啊？

37288

21

0

this xml file does not appear to have any style in

51578

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60730

31

0

重启Docker后报错：Error response from daemon

2090

0

0

配置了安全组规则，端口还是无法访问

33245

25

0

OSS的endpoint如何查看

37339

6

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

133003

28

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3471

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

dataset的版本问题导致与modelscope不兼容

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

在ModelScope中，下载模型时的ssl问题怎么解决？!

关于模型的下载，huggingface下载速度太慢，如何在modelscope快速下载？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

在ModelScope中，请问模型下载到本地的具体方法？

展开全部

Meta SAM3开源：让图像分割，听懂你的话

AgentEvolver：让智能体系统学会「自我进化」

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

Z-Image：冲击体验上限的下一代图像生成模型

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Gemini 3 Nano Banana 的MCP服务器开发设计和国内直连方案

阿里云通义千问向全社会开放！

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

展开全部

还有其他疑问?