开发者社区 问答 正文

嘈杂环境下的说话人识别面临哪些挑战,您团队是如何应对的?

嘈杂环境下的说话人识别面临哪些挑战,您团队是如何应对的?

展开
收起
萝卜丝丸子 2024-08-19 21:25:25 56 分享 版权
1 条回答
写回答
取消 提交回答
  • 嘈杂环境下的说话人识别面临背景噪声干扰导致的性能下降等挑战。我们提出了一种说话人自适应噪声过滤机制,通过说话人嵌入向量和训练好的声源分离mask得到去噪后的子空间特征,进而提升说话人识别的准确性。在缺乏参考音频和理想掩码的情况下,我们采用当前音频作为参考,通过端到端训练共同优化模型。

    2024-08-19 22:33:42
    赞同 3 展开评论
问答分类:
问答地址: