开发者社区> 问答> 正文

为什么需要提出Diagonal Attention Pooling(Ditto)这种方法?

为什么需要提出Diagonal Attention Pooling(Ditto)这种方法?

展开
收起
夹心789 2024-06-24 20:31:09 34 0
1 条回答
写回答
取消 提交回答
  • 尽管BERT在语义编码上显示出一定的能力,但其句子嵌入的利用可能并未达到最佳。我们观察到某些自注意力头与单词的重要性相关,因此假设BERT中的注意力信息需要进一步利用。Diagonal Attention Pooling(Ditto)方法就是为了更有效地利用BERT中的注意力信息,通过计算对角线注意力来加权隐藏状态,从而改善PLM的句子嵌入。

    2024-06-24 20:52:38
    赞同 1 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载