文档备案控制台

开发者社区 ModelScope模型即服务正文

想研究下基于modelscope-funasr同时支持说话人识别与热词，里面是有什么技术障碍吗？

想研究下基于modelscope-funasr同时支持说话人识别与热词，里面是有什么技术障碍吗？

展开

收起

嘟嘟嘟嘟嘟嘟 2024-01-05 07:59:00 230 版权

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
基于ModelScope-FunASR同时支持说话人识别与热词，可能会遇到以下技术障碍：
1. 多任务学习问题：在单个模型中同时进行说话人识别和热词检测需要处理多任务学习的问题。这涉及到如何有效地结合两个任务的特征，以及如何处理两者之间可能存在的冲突或竞争关系。
2. 数据平衡问题：说话人识别和热词检测的数据分布可能有所不同，导致模型在某些特定任务上的性能下降。例如，某些说话人的语音样本可能较少，或者某些热词在训练数据中的出现频率较低。
3. 模型结构与参数调整：为了同时优化两个任务，可能需要对模型的结构进行调整，或者使用一些特定的技术，如多任务学习中的权重共享或硬共享等。此外，模型的超参数选择也会受到影响。
4. 实时性要求：如果应用场景需要实时的热词检测和说话人识别，那么模型的推理速度和延迟就变得尤为重要。这可能需要对模型进行一些剪枝或量化操作，以减少模型的大小和计算复杂度。
5. 模型更新与维护：随着时间的推移，新的说话人和热词可能会不断出现，这就需要模型能够快速地进行更新和维护，以适应这些变化。
6. 许可证与合规性：在使用FunASR或其他相关模型时，需要确保遵循相关的模型许可协议。
2024-01-06 11:54:26

赞同展开评论

相关问答

modelscope-funasr热词是直接在model.generate这样添加吗？

813

1

0

docker部署modelscope-funasr如何识别不同人说话？

527

0

0

modelscope-funasr的时间戳与热词能同时用吗？

390

0

0

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

660

0

0

modelscope-funasr微调的时候。热词如何添加呢？

576

1

0

modelscope-funasr的热词是只在推理阶段做吗？

329

0

0

在modelscope-funasr用的paraformer的一个语音识别模型，怎么加上热词？

515

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

441

0

0

modelscope-funasr的这俩个模型在说话人之外的方面有差异点嘛？

446

0

0

modelscope-funasr的paraformer热词版本配置是不是不支持添加权重？

619

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉答疑群：44837352

我要提问

相关文章

AI 英语学习智能体的开发

AI 英语在线考试平台的开发费用

基于百炼CLI搭建音频处理流水线：CosyVoice配音、Paraformer转写与语音翻译的端到端实践

阿里云AI通用节省计划详细介绍：核心优势、支持的抵扣范围、开通流程与最新优惠

AI英语智能体的开发技术

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

老师请问下，StructBERT FAQ问答-中文-通用领域-base这个模型，加载自己本地数据训练

请问Modelscope互联网如何访问Notebook的服务呢？

modelscope-funasr 热词如何设置？

IndexTTS 部署报错：No module named 'tn'

ModelScope这个免费额度可以在哪里查询啊？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

展开全部

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

阿里云通义千问向全社会开放！

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

HTTPS 原理

Dropout的深入理解（基础介绍、模型描述、原理深入、代码实现以及变种）

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

LTX-2.3开源：视频生成引擎级升级

ModelScope是什么？魔搭社区AI模型开源社区，模型即服务（MaaS）的共享平台

ModelScope介绍：魔搭社区是什么？在魔搭社区能做哪些事？

展开全部

还有其他疑问?