文档备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr是不是没有同时支持输出时间戳和热词的长音频模型呀？

modelscope-funasr是不是没有同时支持输出时间戳和热词的长音频模型呀？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:29 463 版权

3 条回答

写回答

取消提交回答

sunrr

ModelScope-funasr的Paraformer-large长音频模型确实支持输出带标点的文字以及字级别的时间戳。该模型集成了VAD（语音活动检测）、ASR（自动语音识别）、标点与时间戳功能，因此能够直接对时长为数小时的音频进行识别。此外，它还支持基于ModelScope微调定制模型和batch级解码，能加快推理速度。虽然当前并未看到直接支持热词的功能，但这些特性可能会对您的需求有所帮助。同时，它也提供了多种输入音频方式，如wav.scp、音频bytes、音频采样点、WAV格式等。

2024-01-09 11:58:24

赞同展开评论
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

是的，ModelScope-FunASR的长音频模型确实支持输出时间戳和热词。特别是Paraformer-large长音频模型，它集成了语音端点检测(VAD)、语音识别、标点以及时间戳功能，能够直接对时长为数小时的音频进行识别，并输出带标点的文字以及字级别的时间戳。同时，该模型还具有基于用户的热词列表增强记忆的功能，可以提升模型对热词的召回和精度。因此，对于您的需求，使用Paraformer-large长音频模型应该是一个不错的选择。

2024-01-06 11:59:00

赞同展开评论
番茄酱脑袋

没错，目前这种需求，只能用社区软件包哈（onnx）。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-05 08:27:34

赞同展开评论

相关问答

modelscope-funasr的seaco模型，热词有优先级吗？

391

0

0

在modelscope-funasr为什么识别的内容和音频不一致呀？

224

1

0

modelscope-funasr的热词方案对热词的数量有要求吗，如果有上万个热词，这个方案还行吗？

485

1

0

modelscope-funasr离线版的翻译返回的时间戳是一句话的结束时间吗？

331

0

0

modelscope-funasr的时间戳与热词能同时用吗？

309

0

0

在modelscope-funasr换了带时间戳的模型但是语音转出来的结果为什么没有时间戳呢？

388

0

0

modelscope-funasr微调的时候。热词如何添加呢？

501

1

0

modelscope-funasr 可以输入音频吗而不是文件？

262

1

0

modelscope-funasr的时间戳偏移了，怎么处理？

231

0

0

在modelscope-funasr根据文档跑出的结果，没有时间戳。怎么回事？

265

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

热门讨论

热门文章

ModelScope中，灵积模型服务怎么看账单比如如何看我的免费token额度还剩下多少?

ModelScope这个是什么情况，打不开 notebook？

ModelScope中，模型下载默认路径在哪个路径？

com/action/joingroup?code=v1是什么意思

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

在魔塔社区-模型服务里面一键部署的deepseek模型怎么使用？

qwen3-32b和qwen-2.5-32b-Instruct有什么区别

如何修改通义千问的system prompt，以修改自定义名字

展开全部

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

AgentScope：阿里开源多智能体低代码开发平台，支持一键导出源码、多种模型API和本地模型部署

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

阿里开源AI视频生成大模型 Wan2.1：14B性能超越Sora、Luma等模型，一键生成复杂运动视频

LTX-2.3开源：视频生成引擎级升级

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Claude Cowork 支持第三方模型接入开放而不开源

Seedance vs Sora vs Kling：AI 视频生成模型深度对比

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

展开全部

还有其他疑问?