开发者社区 问答 正文

说话人分割的流程是怎样的?

说话人分割的流程是怎样的?

展开
收起
夹心789 2024-06-24 20:30:23 40 分享 版权
1 条回答
写回答
取消 提交回答
  • 说话人分割首先使用VAD模型去除语音中静音片段,再通过说话人特征提取模型CAM++或ERes2Net提取鲁棒性的说话人矢量,最后使用经典聚类算法K-均值或谱聚类得到各说话人的时间戳对原语音片段进行分割。

    2024-06-24 20:43:18
    赞同 1 展开评论
问答分类:
问答地址: