开发者社区> 问答> 正文

使用persist的场景有哪些?

使用persist的场景有哪些?

展开
收起
芯在这 2021-12-07 16:23:20 260 0
1 条回答
写回答
取消 提交回答
  • 1)某个步骤计算非常耗时,需要进行persist持久化

    2)计算链条非常长,重新恢复要算很多步骤,很好使,persist

    3)checkpoint所在的rdd要持久化persist,

    lazy级别,框架发现有checnkpoint,checkpoint时单独触发一个job,需要重算一遍,checkpoint前

    要持久化,写个rdd.cache或者rdd.persist,将结果保存起来,再写checkpoint操作,这样执行起来会非常快,不需要重新计算rdd链条了。checkpoint之前一定会进行persist。

    4)shuffle之后为什么要persist,shuffle要进性网络传输,风险很大,数据丢失重来,恢复代价很大

    5)shuffle之前进行persist,框架默认将数据持久化到磁盘,这个是框架自动做的。

    2021-12-07 16:23:36
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载