A list of partition
一个RDD有一系列的分区/分片
A function for computing each split/partition 对RDD的每一个分区/分片都作用同一个函数
A list of dependencies on others RDDs 有一些依赖,在其他的RDD上
Optionally,a Partitioner for key-value RDDs(e.g to say that the RDD is hash-partitioned) 可选的,对于key-value的RDD的分区策略。
Optionally,a list of preferred locations to compute each split on(e.g. block locations for an HDFS file) 可选的,数据在哪儿优先把作业调度到数据所在节点进行计算:移动数据不如移动计算
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。