文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr中paraformer长音频版与large模型有什么关系？

modelscope-funasr中paraformer长音频版与paraformer large模型有什么关系？可以直接微调paraformer长音频版吗？还是需要微调paraformer large模型？

展开

收起

三分钟热度的鱼 2024-02-28 15:28:03 385 版权

2 条回答

写回答

取消提交回答

鑫宝Code

搞笑前端工程师

在阿里云的ModelScope-Funasr中，Paraformer长音频版和Paraformer Large模型都是基于Paraformer框架的变体，但它们针对的应用场景和设计目标有所不同。

Paraformer长音频版主要针对长音频的处理进行了优化，它能够更好地处理长时间连续语音的识别任务。这通常是通过改进模型的内存管理和解码策略来实现的，以便更有效地处理长序列数据。

而Paraformer Large模型则主要关注于提高模型的性能和准确度，通过增加模型的规模和复杂性来实现。这意味着它可能会有更多的参数和更深层的网络结构，从而提供更好的语音识别效果，尤其是在需要处理大量不同语音和口音的场景中。

至于微调的问题，这取决于您的具体需求和目标。如果您的应用场景主要是长音频处理，那么直接微调Paraformer长音频版可能更为合适，因为它已经针对长音频进行了优化。然而，如果您需要在长音频处理的基础上进一步提升识别的准确度和鲁棒性，那么您可能需要在Paraformer Large模型的基础上进行微调，以利用其更强大的识别能力。

总的来说，两者之间的关系是互补的，您可以根据实际需求选择适合的模型进行微调。在实际操作中，可能需要进行一些实验和调整，以找到最适合您需求的微调策略。

2024-04-13 09:05:03

赞同展开评论
圆不溜秋的小猫猫

由于显存限制，asr模型输入时长需要小于20s，也就是短音频，在asr模型前面加一个vad模型，就可以输入任意时长的音频了。vad与asr模型可以自由组合，我们官方提供的长音频，就是我们给你默认组合好了，你也可以自己组合。此回答整理自钉群“modelscope-funasr社区交流”

2024-02-28 16:25:54

赞同展开评论

相关问答

在modelscope-funasr为什么识别的内容和音频不一致呀？

246

1

0

modelscope-funasr 可以输入音频吗而不是文件？

296

1

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

488

0

0

modelscope-funasr的音频情感识别，用sensevoice好还是emotion2ve？

422

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

596

0

0

modelscope-funasr的paraformer推理的显存是有什么决定的，为啥会不太稳定？

421

1

0

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？

545

0

0

您好我想问一下，在modelscope用OneKE模型去做知识图谱应该用re 还是ner 呀？

217

0

0

在modelscope-funasr中请问vad模型是只能用16k采样率的音频吗？

259

0

0

modelscope-funasr的paraformer-zh-streaming 模型支持微调吗？

1143

3

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

一句话查高铁票并写入文件：揭秘 IntentOrch 的意图驱动编排黑科技

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

相关解决方案

更多

GLM-5.2：长任务时代开源旗舰模型

OpenAI 重磅开源，快速部署GPT-OSS模型

基于 Spark 和 PyTorch 的模型训练方案

模型蒸馏：让0.6B模型媲美235B模型

一键训练模型及部署GPU共享推理服务

热门讨论

热门文章

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr这个报错怎么处理？

modelscope-funasr 热词如何设置？

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

如何修改通义千问的system prompt，以修改自定义名字

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

modelscope-funasr解析出来的角色人对话不全，是哪里参数没设置对吗？

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

展开全部

还有其他疑问?