开发者社区> 问答> 正文

Spark累加器有哪些特点?

Spark累加器有哪些特点?

展开
收起
茶什i 2019-10-29 10:55:38 2945 0
2 条回答
写回答
取消 提交回答
  • 累加器是Spark的一种变量,顾名思义该变量只能增加。有以下特点:

    1,累加器只能在Driver端构建及并只能是Driver读取结果,Task只能累加。

    2,累加器不会改变Spark Lazy计算的特点。只会在Job触发的时候进行相关累加操作。

    3,现有累加器的类型。

    2020-03-19 19:55:05
    赞同 展开评论 打赏
  • 1)累加器在全局唯一的,只增不减,记录全局集群的唯一状态
    2)在exe中修改它,在driver读取
    3)executor级别共享的,广播变量是task级别的共享
    两个application不可以共享累加器,但是同一个app不同的job可以共享

    2019-10-30 14:47:34
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载