备案控制台

开发者社区 ModelScope模型即服务自然语言处理正文

在modelscope-funasr发现声纹出现了一百多个说话人，这是为什么？

我有一段长音频是通过一个3分钟的wav重复30遍组合而成的，音频里都是一个人在说话，然后我用下面的代码推理的时候，在modelscope-funasr发现声纹出现了一百多个说话人，这是为什么？
from funasr import AutoModel

model = AutoModel(model="/workspace/model/download/speech_seaco_paraformer_large_asr_nat-zh-cn-16k-common-vocab8404-pytorch", model_revision="v2.0.4", \
vad_model="/workspace/model/download/speech_fsmn_vad_zh-cn-16k-common-pytorch", vad_model_revision="v2.0.4", \
punc_model="/workspace/model/download/punc_ct-transformer_zh-cn-common-vocab272727-pytorch", punc_model_revision="v2.0.4",\
spk_model="/workspace/model/download/speech_campplus_sv_zh-cn_16k-common", spk_model_revision="v2.0.2",
)

展开

收起

三分钟热度的鱼 2024-04-03 22:01:29 373 版权

0 条回答

写回答

取消提交回答

相关问答

docker部署modelscope-funasr如何识别不同人说话？

356

0

0

modelscope-funasr实现runtime编译成sdk后怎么支持说话人分离？

193

0

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

247

0

0

modelscope-funasr的这俩个模型在说话人之外的方面有差异点嘛？

194

0

0

modelscope-funasr的多说话人语音识别模型支持实时听写吗？

235

0

0

在modelscope-funasr中SenceVoice能和cam++搭配实现说话人确认吗？

308

0

0

modelscope-funasr能区分说话人了吗？

100

0

0

modelscope-funasr的识别说话人的功能要如何配置？

118

0

0

modelscope-funasr有支持实时流式识别和说话人的产品吗？

114

0

0

modelscope-funasr有什么方法可以优化一下Paraformer+cam++多人说话呢？

146

0

0

ModelScope模型即服务

自然语言处理

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

我要提问

相关文章

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

阿里云服务器按量付费优惠参考：GPU实例按量特惠0.9折，按量达标满50返50券介绍

“2025年AI革新启航：揭榜挂帅，赋能工业新纪元先锋工程启动”

AR眼镜在核电操作智能监护应用技术方案｜阿法龙XR云平台

数字人平台数字分身技术分析

热门讨论

热门文章

modelscope-funasr如何释放显存呢？

modelscope-funasr的SenseVoiceLarge模型在哪里啊？

练的pth模型文件，怎么转成bin文件？

modelscope-funasr 热词如何设置？

在modelscope-funasr想自己训练一种low resource 的方言，有训练的方案吗？

modelscope-funasr实时设别，mode:2pass 还是online，2个有啥不一样？

部署funasr-sdk-cpu-0.4.7，无法切换vad为8k模型，提示不存在v2.0.6版本

modelscope-funasr实时ASR的微调该怎么操作？

如何下载llama模型到本地？

modelscope-funasr的asr，itn，标点这几个模块串起来的例子有吗，流式运行？

展开全部

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

KTransformers：告别天价显卡！国产框架让单卡24G显存跑DeepSeek-R1 671B大模型：推理速度飙升28倍

蚂蚁百宝箱联手深铁打造全国首个地铁 AI 智能体「深铁宝」：你的全能城市向导来啦~

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

SPO：如何优化提示词？大模型最懂如何优化自己！开源自监督提示词优化工具，让AI自主优化提示词

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

Memoripy：支持 AI 应用上下文感知的记忆管理 Python 库

展开全部

还有其他疑问?