开发者社区 问答 正文

说一下 cache 和 checkpoint 的区别

说一下 cache 和 checkpoint 的区别

展开
收起
愚笨如你 2020-02-14 19:20:45 1014 分享 版权
1 条回答
写回答
取消 提交回答
  • 要知道区别,首先要知道实现的原理和使用的场景 catche 的就是将共用的或者重复使用的 RDD 按照持久化的级别进行缓存 checkpoint 的是将业务场景非常长的逻辑计算的中间结果缓存到 HDFS 上,它的实现原理是: 首先找到 stage 最后的 finalRDD,然后按照 RDD 的依赖关系进行回溯,找到使用了 checkPoint 的 RDD 然后标记这个使用了 checkPoint 的 RDD 重新的启动一个线程来将 checkPoint 之前的 RDD 缓存到 HDFS 上面最后将 RDD 的依赖关系从 checkPoint 的位置切断知道了实现的原理和使用场景后我们就很容易的知道了 catch 和 checkpoint 的区别了。

    2020-02-14 19:21:03
    赞同 展开评论
问答地址: