开发者社区 > ModelScope模型即服务 > 语音 > 正文

您好,我想请问一下FRCRN是如何保证因果的呢?

文章中在skip pathway处使用了CCBAM,但是CCBAM在时间维度作了池化,那么在推理过程中是如何保证因果呢?

展开
收起
游客cb5efdihef7zu 2022-11-24 17:48:58 1398 0
2 条回答
写回答
取消 提交回答
  • 为了保证推理时的因果,可以在时间维度上使用累加池化,也就是沿时间帧逐步进行池化操作,这和在Conv-TasNet论文里提出的 cumulative layer normalization (cLN)类似;或者像实现Transformer的注意力阵列一样加入时间掩蔽。

    2022-11-25 11:38:49
    赞同 展开评论 打赏
  • 凡事预则立,不预则废

    提出了一种卷积递归编码器-解码器结构(CRED),以增强基于频率递归的特征表示。将频率递归应用于沿频率轴的三维卷积特征映射,并通过前馈顺序记忆网络有效地实现。FRCRN模型利用CRED捕捉长程频率相关性,利用时间循环模块捕捉时间动态。在复数域实现了FRCRN,并使用联合损失函数进行优化。FRCRN模型在宽带基准上实现了SOTA性能,并在ICASSP

    2022-11-24 22:05:15
    赞同 展开评论 打赏

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载