开发者社区 问答 正文

要持久化一个RDD的方法是什么?

要持久化一个RDD的方法是什么?

展开
收起
游客nxq6attzvywgk 2021-12-06 20:17:45 534 分享 版权
1 条回答
写回答
取消 提交回答
  • 要持久化一个RDD的方法是只要调用其cache()或者persist()方法即可。在该RDD第一次被计算出来时,就会直接缓存在每个节点中。而且Spark的持久化机制还是自动容错的,如果持久化的RDD的任何partition丢失了,那么Spark会自动通过其源RDD,使用transformation操作重新计算该partition。

    2021-12-06 20:18:12
    赞同 展开评论
问答分类:
问答地址: