开发者社区> 问答> 正文

spark中RDD之所以为“弹性”的特点的原因有什么?

spark中RDD之所以为“弹性”的特点的原因有什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-10 13:15:08 385 0
1 条回答
写回答
取消 提交回答
    1. 基于Lineage的高效容错(第n个节点出错,会从第n-1个节点恢复,血统容错);

    2. Task如果失败会自动进行特定次数的重试(默认4次);

    3. Stage如果失败会自动进行特定次数的重试(可以值运行计算失败的阶段),只计算失败的数据分片;

    4. 数据调度弹性:DAG TASK 和资源管理无关;

    5. checkpoint;

    6. 自动的进行内存和磁盘数据存储的切换;

    2021-12-10 13:27:52
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载