开发者社区> 问答> 正文

Spark中的Partitioner的作用是什么?

Spark中的Partitioner的作用是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-10 13:21:43 397 0
1 条回答
写回答
取消 提交回答
  • Partitioner决定RDD的分区方式。

    RDD的分区方式主要包含两种(HashPartitioner和RangePartitioner),这两种分区类型都是针对Key-Value类型的数据。如是非Key-Value类型,则分区为None。 Hash是以key作为分区条件的散列分布,分区数据不连续,极端情况也可能散列到少数几个分区上,导致数据不均等;Range按Key的排序平衡分布,分区内数据连续,大小也相对均等。

    2021-12-10 13:22:02
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载