开发者社区> 问答> 正文

spark的Transformation算子groupByKey([numTasks])功能是什么?

spark的Transformation算子groupByKey([numTasks])功能是什么?

展开
收起
游客y244y7ln2rlpa 2021-12-08 19:26:55 623 0
1 条回答
写回答
取消 提交回答
  • spark的Transformation算子groupByKey([numTasks])功能是在一个PairRDD或(k,v)RDD上调用,返回一个(k,Iterable )。主要作用是将相同的所有的键值对分组到一个集合序列当中,其顺序是不确定的。groupByKey是把所有的键值对集合都加载到内存中存储计算,若一个键对应值太多,则易导致内存溢出。

    2021-12-08 19:27:25
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载