RDD和他依赖的父RDD的关系有两种不同的类型,即窄依赖(narrow dependency)和宽依赖(wide dependency)。
宽依赖:指的是多个子RDD的partition会依赖同一个父RDD的partition。
窄依赖:指的是每一个父RDD的partition最多被子RDD的一个Partition使用。
父RDD中,每个分区内的数据,都只会被子RDD中特定的分区所消费,为窄依赖:
父RDD中,分区内的数据,会被子RDD内多个分区消费,则为宽依赖
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。