开发者社区 问答 正文

spark优化中广播变量是什么?

spark优化中广播变量是什么?

展开
收起
芯在这 2021-12-06 01:13:15 317 分享 版权
1 条回答
写回答
取消 提交回答
  • 使用广播变量在sparkContext中,可以大幅降低每一个序列化task这个对象的大小,集群中启动一个job的成本也会降低。如果你的task中使用了一个大对象(large object),考虑把他优化成一个广播变量。通常来说,一个task大于20KB就值得优化。

    2021-12-06 01:13:28
    赞同 展开评论