文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr通义听悟里面的语音识别用的是funasr框架里面可组合的模型吗？

modelscope-funasr通义听悟里面的语音识别和声纹识别，用的是funasr框架里面可组合的模型吗？
是这四个吗？我测的听悟里面的转文字和声纹感觉都比我自己测的好，是模型不一样还是他们做了一些别的处理？

展开

收起

三分钟热度的鱼 2024-03-20 15:45:53 481 版权

1 条回答

写回答

取消提交回答

请看我回答~

阿里云大降价~

ModelScope-Funasr通义听悟里面的语音识别和声纹识别确实使用了Funasr框架里面可组合的模型。

ModelScope-Funasr是一个基于深度学习的语音识别模型，它利用了阿里达摩院自研的技术和模型。具体来说，通义听悟中的语音识别功能主要依托于Paraformer非自回归端务。此外，Funasr还支持标点符号识别、低语音识别、音频-视觉语音识别等功能，这些功能的加入可以显著提高语音转写的准确性和可用性。

至于您提到的转文字和声纹识别感觉比自己测试的好，这可能是因为他们使用了更先进的模型或者是进行了一些额外的优化处理。例如，他们可能对模型进行了特定的训练，或者在后处理阶段加入了一些算法来提高识别结果的质量。此外，专业的语音识别服务通常会有一套完整的数据清洗和模型调优流程，这些都是提升识别效果的重要因素。

总的来说，ModelScope-Funasr通义听悟的语音识别和声纹识别功能得益于Funasr框架的强大模型和技术支持，以及可能的额外优化措施，从而确保了较高的识别准确率和用户体验。

2024-03-27 19:25:11

赞同展开评论

相关问答

modelscope-funasr的实时语音识别支持的并发数在哪里可以看？

617

1

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

506

0

0

modelscope-funasr的多说话人语音识别模型支持实时听写吗？

364

0

0

UNIVERSAL-ASR语音识别基础框架的主要特点是什么？

269

1

0

语音识别基础框架经历了怎样的演变？

280

1

0

UNIVERSAL-ASR语音识别基础框架的主要特点是什么？

156

1

0

语音识别基础框架经历了怎样的演变？

202

1

0

在modelscope-funasr中有没有用做实时语音转文字的demo？

271

1

0

我使用modelscope进行语音识别时很慢。

821

0

0

在modelscope-funasr中官方实例语音识别pcm报错是什么问题?

246

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

出海业务多语言云客服系统技术白皮书：工单国际化、知识库同步与跨区域坐席协同的架构设计与实现

当"拟人化"退潮，留下来的是能证明"这是真人说的"系统

Synerow AI Agent架构解析：意图识别、工具调用与工单闭环

AI英语教培系统的开发

AI英语学习智能体的开发费用

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

基于 Spark 和 PyTorch 的模型训练方案

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

企业上云框架 Landing Zone

热门讨论

热门文章

modelscope-funasr 热词如何设置？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

langchain中llms.Tongyi 这个模型具体调用的是哪个通义模型

modelscope-funasr出现以下报错，该用什么funasr版本？

modelscope-funasr基于paraformer微调了粤语试了下，效果不太理想。怎么调整？

如何将space-t-cn的模型导出为onnx格式

如何修改通义千问的system prompt，以修改自定义名字

gpt3,加载数据时，MsDataset.load报错

在modelscope-funasr为啥把语音模型下载到本地，调用识别出的文本为啥会乱码？

展开全部

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

语义压缩，才是提示词工程的底层心法

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

从零搓一个语言模型，然后把它变成认知体的声带

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

展开全部

还有其他疑问?