开发者社区> 问答> 正文

传统Albert为了减少参数总量采用了什么方法?

传统Albert为了减少参数总量采用了什么方法?

展开
收起
游客hmzk6xi5mlygs 2022-05-10 13:16:59 266 0
1 条回答
写回答
取消 提交回答
  • 取消了bert的encoder堆叠的方式,转而采用encoder循环的方式

    2022-05-10 22:40:57
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Blade优化技术在广告计算中的应用优化 立即下载
基于Spark的面向十亿级别特征的 大规模机器学习 立即下载
基于Spark的面向十亿级别特征的大规模机器学习 立即下载