开发者社区> 问答> 正文

spark中的宽窄依赖?

spark中的宽窄依赖?

展开
收起
不语奈何 2019-11-08 19:06:03 646 0
1 条回答
写回答
取消 提交回答
  • 精于基础,广于工具,熟于业务。

    RDD和他依赖的父RDD的关系有两种不同的类型,即窄依赖(narrow dependency)和宽依赖(wide dependency)。

    宽依赖:指的是多个子RDD的partition会依赖同一个父RDD的partition。

    窄依赖:指的是每一个父RDD的partition最多被子RDD的一个Partition使用。

    父RDD中,每个分区内的数据,都只会被子RDD中特定的分区所消费,为窄依赖:

    父RDD中,分区内的数据,会被子RDD内多个分区消费,则为宽依赖

    2019-11-08 19:06:34
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载