大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day19】—

大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day19】——Spark6

2023-12-25 108

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day19】——Spark6

停🤚
不要往下滑了，
默默想5min，
看看这5道面试题你都会吗？

面试题 01、RDD机制？
面试题02、什么是RDD宽依赖和窄依赖？
面试题 03、cache和pesist的区别？
面试题04、cache后面能不能接其他算子,它是不是action操作？
面试题05、reduceByKey是不是action？

以下答案仅供参考：

面试题 01、RDD机制？

rdd分布式弹性数据集，简单的理解成一种数据结构，是spark框架上的通用货币。所有算子都是基于rdd来执行的，不同的场景会有不同的rdd实现类，但是都可以进行互相转换。rdd执行过程中会形成dag图，然后形成lineage保证容错性等。从物理的角度来看rdd存储的是block和node之间的映射。

1）粗粒度：启动时就分配好资源，程序启动，后续具体使用就使用分配好的资源，不需要再分配资源；优点：作业特别多时，资源复用率高，适合粗粒度；缺点：容易资源浪费，假如一个job有1000个task，完成了999个，还有一个没完成，那么使用粗粒度，999个资源就会闲置在那里，资源浪费。

2）细粒度分配：用资源的时候分配，用完了就立即回收资源，启动会麻烦一点，启动一次分配一次，会比较麻烦。

面试题02、什么是RDD宽依赖和窄依赖？

RDD和它依赖的parent RDD(s)的关系有两种不同的类型，即窄依赖（narrow dependency）和宽依赖（wide dependency） 1）窄依赖指的是每一个parent RDD的Partition最多被子RDD的一个Partition使用 2）宽依赖指的是多个子RDD的Partition会依赖同一个parent RDD的Partition

面试题03、cache和pesist的区别？

cache和persist都是用于将一个RDD进行缓存的，这样在之后使用的过程中就不需要重新计算了，可以大大节省程序运行时间

1） cache只有一个默认的缓存级别MEMORY_ONLY ，cache调用了persist，而persist可以根据情况设置其它的缓存级别；

2）executor执行的时候，默认60%做cache，40%做task操作，persist是最根本的函数，最底层的函数。

面试题04、 cache后面能不能接其他算子,它是不是action操作？

cache可以接其他算子，但是接了算子之后，起不到缓存应有的效果，因为会重新触发cache。 cache不是action操作。

面试题05、reduceByKey是不是action？

不是，很多人都会以为是action，reduce rdd是action

总结

今天我们复习了面试中常考的Spark相关的五个问题，你做到心中有数了么？

其实做这个专栏我也有私心，就是希望借助每天写一篇面试题，督促自己学习，以免在面试期间尴尬！平时不流汗,面试多流泪!

对了，如果你的朋友也在准备面试，请将这个系列扔给他，

好了，今天就到这里，学废了的同学，记得在评论区留言：打卡。给同学们以激励。

大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day19】——Spark6

面试题 01、RDD机制？

面试题02、什么是RDD宽依赖和窄依赖？

面试题03、cache和pesist的区别？

面试题04、 cache后面能不能接其他算子,它是不是action操作？

面试题05、reduceByKey是不是action？

总结

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大数据开发岗面试复习30天冲刺 - 日积月累，每日五题【Day19】——Spark6

面试题 01、RDD机制？

面试题02、什么是RDD宽依赖和窄依赖？

面试题03、cache和pesist的区别？

面试题04、 cache后面能不能接其他算子,它是不是action操作？

面试题05、reduceByKey是不是action？

总结

热门文章

最新文章

相关课程

相关电子书