开发者社区> 问答> 正文

Spark的数据本地性什么?

Spark的数据本地性什么?

展开
收起
xin在这 2021-12-07 17:36:21 440 0
1 条回答
写回答
取消 提交回答
  • Spark中的数据本地性有三种:

    a.PROCESS_LOCAL是指读取缓存在本地节点的数据

    b.NODE_LOCAL是指读取本地节点硬盘数据

    c.ANY是指读取非本地节点数据

    通常读取数据PROCESS_LOCAL>NODE_LOCAL>ANY,尽量使数据以PROCESS_LOCAL或NODE_LOCAL方式读取。其中PROCESS_LOCAL还和cache有关,如果RDD经常用的话将该RDD cache到内存中,注意,由于cache是lazy的,所以必须通过一个action的触发,才能真正的将该RDD cache到内存中。

    2021-12-07 17:36:52
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载