备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr通义听悟里面的语音识别用的是funasr框架里面可组合的模型吗？

modelscope-funasr通义听悟里面的语音识别和声纹识别，用的是funasr框架里面可组合的模型吗？
是这四个吗？我测的听悟里面的转文字和声纹感觉都比我自己测的好，是模型不一样还是他们做了一些别的处理？

展开

收起

三分钟热度的鱼 2024-03-20 15:45:53 236 版权

1 条回答

写回答

取消提交回答

请看我回答~

阿里云大降价~

ModelScope-Funasr通义听悟里面的语音识别和声纹识别确实使用了Funasr框架里面可组合的模型。

ModelScope-Funasr是一个基于深度学习的语音识别模型，它利用了阿里达摩院自研的技术和模型。具体来说，通义听悟中的语音识别功能主要依托于Paraformer非自回归端务。此外，Funasr还支持标点符号识别、低语音识别、音频-视觉语音识别等功能，这些功能的加入可以显著提高语音转写的准确性和可用性。

至于您提到的转文字和声纹识别感觉比自己测试的好，这可能是因为他们使用了更先进的模型或者是进行了一些额外的优化处理。例如，他们可能对模型进行了特定的训练，或者在后处理阶段加入了一些算法来提高识别结果的质量。此外，专业的语音识别服务通常会有一套完整的数据清洗和模型调优流程，这些都是提升识别效果的重要因素。

总的来说，ModelScope-Funasr通义听悟的语音识别和声纹识别功能得益于Funasr框架的强大模型和技术支持，以及可能的额外优化措施，从而确保了较高的识别准确率和用户体验。

2024-03-27 19:25:11

赞同展开评论

相关问答

qwen3-asr-flash 模型的HTTP API接口不支持本地文件上传吗？

25

1

0

使用 dashscope-sdk-java 调用qwen3-max-preview模型回答问题，没有

29

0

0

C-MTEB评估qwen模型

67

0

0

怎么使用vllm部署最新的qwen3的mbedding 和reranker模型呢

727

0

0

通义灵码能不能自定义LLM模型？

303

1

0

使用qwen-mt-turbo模型的openapi限流如何解除

276

0

0

qwen模型微调上传数据集时，如何书写数据集的本地路径？

117

0

0

qwen-long模型

119

1

0

vscode集成通义灵码后，使用deepseek模型，会经常遇到连接超时的情况

355

2

0

通义千问语音识别大模型API 本地上传报错 InvalidParameter问题如何解决？

1065

1

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

面向能效和低延迟的语音控制智能家居：离线语音识别与物联网集成方案——论文阅读

基于MFCC（梅尔频率倒谱系数）和GMM（高斯混合模型）的语音识别

让每次语音唤醒都可靠，公牛沐光重构可观测体系

22_注意力机制详解：从基础到2025年最新进展

阿里云百炼产品月刊【2025年9月】

热门讨论

热门文章

modelscope-funasr 热词如何设置？

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

自然语言处理大模型，对word文本格式检测

如何下载llama模型到本地？

modelscope-funasr有没有开源的语音唤醒，自定义唤醒？

modelscope-funasr实时语音离线部署测试，没有标点了怎么解决？

modelscope-funasr的python websocket怎么实现多用户并发啊？

modelscope-funasr支持粤语么？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

FastExcel：开源的 JAVA 解析 Excel 工具，集成 AI 通过自然语言处理 Excel 文件，完全兼容 EasyExcel

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

Mooncake：月之暗面Kimi联合清华等机构推出的大模型推理架构

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

展开全部

还有其他疑问?