开发者社区 问答 正文

Ditto方法是如何解决预训练语言模型句子嵌入存在的各向异性问题的?

Ditto方法是如何解决预训练语言模型句子嵌入存在的各向异性问题的?

展开
收起
夹心789 2024-06-24 20:31:11 46 分享 版权
1 条回答
写回答
取消 提交回答
  • Ditto方法通过利用基于模型的重要性估计对单词进行加权,并计算预训练模型中单词表示的加权平均值作为句子嵌入,来缓解各向异性问题。它利用对角线注意力池化(Ditto)这一无监督方法,作为后处理操作应用于任何预训练语言模型,无需增加参数或进行任何学习。

    2024-06-24 20:52:25
    赞同 1 展开评论
问答地址: