开发者社区 问答 正文

哪些 RDD 需要 checkpoint?

哪些 RDD 需要 checkpoint?

展开
收起
芯在这 2021-12-07 22:37:37 255 分享 版权
1 条回答
写回答
取消 提交回答
  • 运算时间很长或运算量太大才能得到的 RDD,computing chain 过长或依赖其他 RDD 很多的 RDD。实际上,将 ShuffleMapTask 的输出结果存放到本地磁盘也算是 checkpoint,只不过这个 checkpoint 的主要目的是去 partition 输出数据。

    2021-12-07 22:37:50
    赞同 展开评论
问答分类:
问答地址: