开发者社区 > ModelScope模型即服务 > 自然语言处理 > 正文

modelscope-funasr中,有什么过说话人识别模型的,今天试了几个录音,发现结果差得离谱?

问题一:modelscope-funasr中,有什么过说话人识别模型的,我今天试了几个录音,发现结果差得有点离谱,只有两个人说话的录音,spk给我整到9了?
问题二:阈值参数应该怎么设置?

展开
收起
提问的橘子 2024-04-19 11:44:35 31 0
1 条回答
写回答
取消 提交回答
  • 针对问题一的回答:阈值不合适吧。
    针对问题二的回答:自己造数据集测的,整了10W条正负样本对测试,找了一个准确率最高的阈值 image.png
    阅读下源码,搜索下thre这个关键词。分别提取声纹特征,计算cosine,二者做差和阈值比较。此回答整理自钉群“modelscope-funasr社区交流”

    2024-04-19 13:45:44
    赞同 展开评论 打赏

包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域

相关电子书

更多
视觉AI能力的开放现状及ModelScope实战 立即下载
ModelScope助力语音AI模型创新与应用 立即下载
低代码开发师(初级)实战教程 立即下载