开发者社区 问答 正文

如何将文本信息引入SEND系统以提升识别性能?

如何将文本信息引入SEND系统以提升识别性能?

展开
收起
萝卜丝丸子 2024-08-19 21:19:08 50 分享 版权
1 条回答
写回答
取消 提交回答
  • 为了利用语音中的语义信息,SEND系统使用ASR识别出的文本,并通过文本编码器Text Encoder将词嵌入码进行编码。随后,采用注意力机制将声学信息与每个字的文本信息进行对齐,得到包含声学和语义多种信息的混合编码。这种混合编码进一步提高了模型的识别性能。image.png

    2024-08-19 22:24:29
    赞同 3 展开评论
问答地址: