备案控制台

开发者社区 ModelScope模型即服务正文

modelscope-funasr听悟是不是用的FunASR？感觉听悟的功能很完善，性能也很好。

modelscope-funasr听悟是不是用的FunASR，感觉听悟的功能很完善，性能也很好。如果自己用FunASR能做到同样的效果就很好了。

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 07:58:14 217 版权

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。

听悟的功能和性能出色，这得益于其背后使用的FunASR技术。FunASR是达摩院语音实验室在Modelscope社区开源的一套语音识别工具包，它集成了包括语音端点检测 (VAD)、Paraformer-large非流式语音识别 (ASR)、Paraformer-large流式语音识别 (ASR)、标点预测 (PUNC) 等相关能力。

具体来说，你可以使用FunASR提供的runtime-SDK来部署实时的语音听写服务。这个软件包既可以实时地进行语音转文字，而且能够在说话句尾用高精度的转写文字修正输出，输出的文字会带有标点。此外，如果你有自己的业务需求，还可以根据需要选择合适的服务器配置。

值得一提的是，FunASR还提供了训练和微调功能。这是一个全面的语音工具包，可以从头开始训练端到端语音识别模型，包括针对AISHELL、WenetSpeech和LibriSpeech等数据集的Transformer、Conformer和Paraformer模型。对于只能访问有限数据和计算资源以从头开始训练模型的学术研究人员和开发人员来说，这个功能尤其有益。因此，如果你愿意，也可以自己使用FunASR来构建类似的应用。

2024-01-06 12:06:26

赞同展开评论
番茄酱脑袋

也是基于Paraformer模型，听悟作为产品，有专门的技术团队来做支持和打磨，体验好是正常的。此回答整理自钉群“modelscope-funasr社区交流”

2024-01-05 08:19:51

赞同展开评论

相关问答

在modelscope-funasr想添加一个映射出funasr目录，为何启动后是空的？

324

13

0

在modelscope-funasr需要增加录音文件的存储功能具体是修改哪个文件啊？

123

0

0

modelscope-funasr用funasr测sensevoice为什么每次都提示下载？

404

0

0

在modelscope-funasr用一块4090来跑funasr能支持到多少路并发？

348

0

0

在modelscope-funasr中sensevoice 和 funasr什么关系？

349

0

0

在modelscope-funasr中funasr 中文实时的可以gpu部署吗？

236

0

0

在modelscope-funasr中funasr 热词后面权重数字，是数字越大识别越准吗？

208

0

0

在modelscope-funasr中FunASR 是否可以提取自定义音频数据的声色？

118

1

0

在modelscope-funasr中想保留解析长音频的功能所以只要有vad在就会影响输出结果是吗？

103

0

0

在modelscope-funasr中funasr有在自有数据集上重新训练新模型的教程吗？

230

1

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope中apikey在哪申请？

dataset的版本问题导致与modelscope不兼容

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

com/action/joingroup?code=v1是什么意思

关于 Windows平台上 ttsfrd 库的问题。

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

展开全部

Z-Image：冲击体验上限的下一代图像生成模型

Qwen3-VL新成员 2B、32B来啦！更适合开发者体质

Agent Skills技术协议与开源实现，让大模型拥有“即插即用”技能

共学 | 2025年，更加有效地搭建Agent

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

中文大模型体验

Z-Image Turbo LoRA训练魔法：如何保持加速生图能力

Meta SAM3开源：让图像分割，听懂你的话

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

通义百聆语音双子星，同步开源！

展开全部

还有其他疑问?