文档备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

modelscope-funasr热词版不支持长音频吗？

modelscope-funasr热词版不支持长音频吗？

展开

收起

三分钟热度的鱼 2024-03-27 17:07:18 257 版权

2 条回答

写回答

取消提交回答

mrq4nk6ni2neg
热词版模型也支持长音频的识别，但输出格式可能有所不同。

ModelScope-FunASR的热词版模型，即Paraformer-large热词版，虽然主要设计是为了提高特定热词的召回率和准确率，但它同样可以处理长音频的语音识别任务。这意味着您可以使用热词版模型来识别包含长时间语音的音频文件。

具体来说，以下是关于ModelScope-FunASR热词版模型的一些详细信息：
- 热词定制功能：热词版模型允许用户基于提供的热词列表进行激励增强，这样可以在识别过程中提升这些特定词汇的识别性能。
- 长音频识别能力：尽管热词版模型的主要特点是热词识别，但它并不限制音频的长度。因此，您可以用它来识别长音频文件。
- 输出格式：对于长音频版本，ModelScope-FunASR提供了VAD（Voice Activity Detection）和ASR（Automatic Speech Recognition）的功能，但是如果您没有看到预期中的标点符号，可能是因为模型的输出格式不包括它们。您可能需要在后处理中添加标点符号和时间戳。
- 预测结果的差异：如果不指定热词列表，热词版模型的预测结果可能会与长音频模型有所不同，因为热词版模型会侧重于识别指定的热词。
综上所述，ModelScope-FunASR的热词版模型不仅能够提升特定词汇的识别效果，也能够处理长音频的识别任务。不过，具体的输出格式和结果可能会根据是否提供热词列表而有所变化。
2024-03-28 22:19:40

赞同 1 展开评论
圆不溜秋的小猫猫

默认是长音频热词模型
此回答整理自钉群“modelscope-funasr社区交流”

2024-03-27 17:21:35

赞同展开评论

相关问答

modelscope-funasr的seaco模型，热词有优先级吗？

417

0

0

在modelscope-funasr为什么识别的内容和音频不一致呀？

248

1

0

modelscope-funasr热词是直接在model.generate这样添加吗？

777

1

0

modelscope-funasr的热词方案对热词的数量有要求吗，如果有上万个热词，这个方案还行吗？

517

1

0

modelscope-funasr的热词是只在推理阶段做吗？

304

0

0

modelscope-funasr 可以输入音频吗而不是文件？

296

1

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

488

0

0

modelscope-funasr的音频情感识别，用sensevoice好还是emotion2ve？

424

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

597

0

0

modelscope-funasr实时流模式，对音频pcm的数据要求是什么呢？

545

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

一句话查高铁票并写入文件：揭秘 IntentOrch 的意图驱动编排黑科技

AI元认知雏形

保密检查在本项目中的总体链路：从按钮到任务清单：免费开源的文档编审软件WPS AI插件.察元AI 文档助手

语义压缩，才是提示词工程的底层心法

阿里云自然语言处理全栈对接指南：从入门到企业级集成实战

热门讨论

热门文章

在modelscope-funasr针对中文通话 SenseVoice和paraforma效果谁好？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

modelscope-funasr这个报错怎么处理？

modelscope-funasr 热词如何设置？

如何修改通义千问的system prompt，以修改自定义名字

我是一个小白，本机部署adaseq，vscode找不到modelscope的module

请问微调开元模型qwe1.5b 和 7b 分别支持数据集的上下文长度是多少个汉字/token？

modelscope-funasr解析出来的角色人对话不全，是哪里参数没设置对吗？

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

使用modelscope、Qwen1.8B-chat 模型推理时报错编码错误

展开全部

[大模型实战 01] 本地大模型初体验：Ollama 部署与 Python 调用指南

CodeArena：在线 LLM 编程竞技场！用于测试不同开源 LLM 的编程能力，实时更新排行榜

使用宝塔面板部署 AstrBot 与 NapCat 实现 QQ 机器人

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

ComfyUI-Copilot：阿里把AI助手塞进ComfyUI：一句话生成工作流，自动布线/调参/选模型，小白秒变大神！

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

[大模型实战 03预备] 云端炼丹房 1：Google Colab 上手指南

FireCrawl：开源 AI 网络爬虫工具，自动爬取网站及子页面内容，预处理为结构化数据

KAG：增强 LLM 的专业能力！蚂蚁集团推出专业领域知识增强框架，支持逻辑推理和多跳问答

展开全部

还有其他疑问?