开发者社区 问答 正文

传统Albert为了减少参数总量采用了什么方法?

传统Albert为了减少参数总量采用了什么方法?

展开
收起
游客hmzk6xi5mlygs 2022-05-10 13:16:59 277 分享 版权
1 条回答
写回答
取消 提交回答
  • 取消了bert的encoder堆叠的方式,转而采用encoder循环的方式

    2022-05-10 22:40:57
    赞同 展开评论
问答地址: