开发者社区 问答 正文

全监督说话人识别框架通常包含哪些部分?

全监督说话人识别框架通常包含哪些部分?

展开
收起
夹心789 2024-06-30 22:45:25 67 分享 版权
1 条回答
写回答
取消 提交回答
  • 全监督说话人识别框架通常由帧级别的特征学习层、特征聚合层、段级别表征学习层和分类层构成。通过说话人区分性的训练准则学习鲁棒性说话人特征矢量。

    2024-06-30 22:56:42
    赞同 3 展开评论
问答分类:
问答地址: