开发者社区> 问答> 正文

spark算子reduceByKey和groupByKey哪一个更有优势?

spark算子reduceByKey和groupByKey哪一个更有优势?

展开
收起
游客y244y7ln2rlpa 2021-12-06 23:01:12 297 0
1 条回答
写回答
取消 提交回答
  • reduceByKey:按照key进行聚合,在shuffle之前有combine (预聚合)操作,返回结果是RDD[k;v]。.

    groupByKey:按照key进行分组,直接进行shuffle

    所以,在实际开发过程中,reduceByKey比groupByKey更建议使用。但是需要注意是否会影响业务逻辑。

    2021-12-06 23:01:47
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载