备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr Paraformer这个模型以后会支持角色分离吗？

modelscope-funasr Paraformer语音识别-中文-通用-16k-离线-large 这个模型以后会支持角色分离吗？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 07:59:00 307 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

目前，ModelScope-FunASR Paraformer语音识别模型主要应用在中文通用的16k离线场景下，并且模型规模为large。这个模型是由达摩院语音团队提出的非自回归端到端语音识别框架，采用工业级数万小时的标注音频进行训练，以确保模型具有较好的通用识别效果。此外，该模型支持魔搭社区开源的工业级的语音识别模型（Paraformer-large）的训练和微调，使得研究人员和开发者可以更加便捷地进行语音识别模型的研究和生产。

2024-01-06 11:54:26

赞同展开评论
番茄酱脑袋

这种单功能的模型只为了做一件事，应该不会增加其它功能。像长音频识别这种组合的模型或转写包才有可能会增加其它附加功能。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-05 09:02:53

赞同展开评论

相关问答

modelscope-funasr有没有docker镜像能支持角色分离的？

801

13

0

modelscope-funasr有语音对话分离demo吗？

231

0

0

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

207

0

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

357

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

256

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

265

1

0

在modelscope-funasr中funasr哪个模型支持角色区分？

170

0

0

modelscope-funasr的mossFormer2的语音分离模型，这种情况是不是不好分离？

212

0

0

modelscope-funasr的语者分离的模型有吗？

106

0

0

modelscope-funasr的paraformer模型从0训练可以用来做音频识别音素模型吗？

128

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

相关文章

2025年热销榜单：头部AI数字人产品推荐

阿里云百炼大模型赋能｜打造企业级电话智能体与智能呼叫中心完整方案

Wispr Flow 平替, 这款开源中文语音助手，程序员真该试试,本地离线的中文语音输入神器来了（开源白嫖版）

【口碑排行】甲方真实的投票：售后服务场景下，客户满意度最高的语音机器人品牌盘点

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

com/action/joingroup?code=v1是什么意思

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

关于 Windows平台上 ttsfrd 库的问题。

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

共学 | 2025年，更加有效地搭建Agent

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

中文大模型体验

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

Meta SAM3开源：让图像分割，听懂你的话

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

通义百聆语音双子星，同步开源！

展开全部

还有其他疑问?