备案控制台

开发者社区 ModelScope模型即服务正文

在modelscope-funasr我使用这个模型，对于短音频，性能很好，是不是需要换长音频模型？

在modelscope-funasr我使用speech_paraformer-large-contextual_asr_nat-zh-cn-16k-common-vocab8404-onnx这个模型，对于短音频，性能很好，长音频，性能差太多了，跟音频时长不成比例，是不是需要换长音频模型？
34.6/1.4=24.7
909.2/202.0=4.5

展开

收起

三分钟热度的鱼 2024-01-17 18:46:38 79 版权

1 条回答

写回答

取消提交回答

圆不溜秋的小猫猫

音频时长超过20s，就需要加vad模型了（长音频）。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-17 19:03:34

赞同展开评论

相关问答

在modelscope-funasr为什么识别的内容和音频不一致呀？

134

1

0

modelscope-funasr 可以输入音频吗而不是文件？

151

1

0

modelscope-funasr的音频情感识别，用sensevoice好还是emotion2ve？

177

0

0

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？

328

0

0

在modelscope-funasr中请问vad模型是只能用16k采样率的音频吗？

143

0

0

在modelscope-funasr中想保留解析长音频的功能所以只要有vad在就会影响输出结果是吗？

91

0

0

modelscope-funasr的双声道的音频文件，想在识别结果上标记左右声道，有建议的方法吗？

159

0

0

在modelscope-funasr，离线和在线的版本在处理音频时有什么区别吗？

216

1

0

modelscope-funasr能推理网络地址的音频文件么？

94

0

0

modelscope-funasr这个模型给的音频文件是中文，为什么识别出来，不是英文就是拼音？

101

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

dataset的版本问题导致与modelscope不兼容

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

从modelscope下载模型失败，怎么回事？

ModelScope下载速度慢怎么解决？

com/action/joingroup?code=v1是什么意思

modelscope-funasr模型选择whisper large v3，不出时间戳是正常的吗？

展开全部

万字长文深度解析最新Deep Research技术：前沿架构、核心技术与未来展望

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Qwen3-VL再添丁！4B/8B Dense模型开源，更轻量，仍强大

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

美团 LongCat-Video 视频生成模型正式发布，探索世界模型的第一步

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

仅100多元，他给视障人群装上AI“眼睛”

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

全新框架 Glyph 开源：用视觉理解文本，3–4 倍上下文压缩，近 5 倍推理提速！

展开全部

还有其他疑问?