开发者社区> 问答> 正文

reduceBykey 和 groupByKey哪个快?

reduceBykey 和 groupByKey哪个快?

展开
收起
愚笨如你 2020-02-14 20:24:24 912 0
1 条回答
写回答
取消 提交回答
  • 然是 reduceBykey 比较快,在到 reduce 端之前会对要传输的结果进行一个本地的 merge,这样到达 reduce端的数据就会大幅度的减少,而 groupbykey 会对每一个过来的 RDD 进行一个序列化,并且这个过程是发生在 reduce 端进行执行的,所以会造成一旦数据量过大的时候会造成内存溢出等麻烦,所以建议还是尽量少用比较好

    2020-02-14 20:24:37
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载