开发者社区> wsc449> 正文

Hadoop笔试题一

简介: Hadoop笔试题一 一、选择题(2分每题,共20分) 1.下面哪个程序负责 HDFS 数据存储。 A NameNode B Jobtracker C Datanode D tasktracker 2.
+关注继续查看

Hadoop笔试题一

一、选择题(2分每题,共20分)

1.下面哪个程序负责 HDFS 数据存储。 
A NameNode 
B Jobtracker 
C Datanode 
D tasktracker 
2.HDfS 中的 block 默认保存几份?
A 3 份 
B 2C 1D 不确定 
3.下列哪个程序通常与 NameNode 在一个节点启动? 
A SecondaryNameNode 
B DataNode 
C TaskTracker 
D Jobtracker
4.HDFS 默认 Block Size 是多少()
A 16MB
B 32MB 
C 64MB 
D 128MB 
5.下列哪项通常是集群的最主要瓶颈: 
A CPU 
B 网络 
C 磁盘 IO 
D 内存 
6.Spark 支持的分布式部署方式中哪个是错误的 ()
A standalone 
B spark on mesos  
C spark on YARN 
D Spark on local
7.下面哪个端口不是 spark 自带服务的端口 ( )
A.8080 
B.4040 
C.8090 
D.18080
8.hive 的元数据存储在 derby 和 MySQL 中有什么区别 ( )
A.没区别 
B.多会话 
C.支持网络环境 
D数据库的区别
9.DataFrame 和 RDD 最大的区别 ( )
A.科学统计支持 
B.多了 schema 
C.存储方式不一样 
D.外部数据源支持
10.下面哪个操作是窄依赖 ( )
A join 
B filter 
C group 
D sort

二、填空题(2分每空共30分)

11.1pb=____kb 
12.大数据的4v特征分别是______、_______、_______、_______。
13.安装完全分布式Apache Hadoop的核心配置文件有______,______,_______,________。
14.Hdfs,yarn,hbase,以及spark资源监控,spark任务监控的默认web端口分为_________,________,________,_________________。
15.spark的on yarn client模式启动命令为__________________

三、命令题(2分每题共10分)

16.删除 hdfs 上的/tmp/xxx 目录命令 

17.hadoop的HDFS文件格式化命令

18.从hadoop0节点的opt目录下拷贝hive2.1.1文件夹,到hadoop1的opt目录下的命令

19.忘了hdfs-site.xml文件在哪了,如何通过命令找到它

20.初始化SparkContext命令

四、简答题(4分每题共20分)

21.Hadoop 集群可以运行的 3 个模式? 

22.如何重启 Namenode? 

23.当 JobTracker 宕掉时,Namenode 会发生什么? 

24.HQuorumPeer进程和QuorumPeerMain进程区别是什么?

25.Spark RDD,DataFrame,DataSet三者之间的区别是什么?(简要描述)

五、代码题(5分每题共10分)

26.选取一种语言实现冒泡排序

27.用mapreduce实现词汇统计,简易描述map和reduce方法

六、逻辑智力题(5分每题共10分)

28.猎人、狼、男人和两个孩子、女人和两个孩子要过河,必须满足的条件:
1.  只有一条每次过两个人的船
2.  狼不能离开猎人同任何人独处
3.  男人的孩子不能与女人独处
4.  女人的孩子也不能与男人独处
5.  只有猎人、男人和女人会划船
问至少需要几次过?(说明过程)
29.赛马,有25匹马,每次只能5匹马进行比赛,比赛只能得到5匹马之间的快慢程度,而不是速度,请问,最少要比多少次,才能获得最快的前3匹马?

答案请参考

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
23575 0
阿里云服务器ECS远程登录用户名密码查询方法
阿里云服务器ECS远程连接登录输入用户名和密码,阿里云没有默认密码,如果购买时没设置需要先重置实例密码,Windows用户名是administrator,Linux账号是root,阿小云来详细说下阿里云服务器远程登录连接用户名和密码查询方法
22329 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
16629 0
阿里云服务器安全组设置内网互通的方法
虽然0.0.0.0/0使用非常方便,但是发现很多同学使用它来做内网互通,这是有安全风险的,实例有可能会在经典网络被内网IP访问到。下面介绍一下四种安全的内网互联设置方法。 购买前请先:领取阿里云幸运券,有很多优惠,可到下文中领取。
22507 0
如何设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云安全组设置详细图文教程(收藏起来) 阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程。阿里云会要求客户设置安全组,如果不设置,阿里云会指定默认的安全组。那么,这个安全组是什么呢?顾名思义,就是为了服务器安全设置的。安全组其实就是一个虚拟的防火墙,可以让用户从端口、IP的维度来筛选对应服务器的访问者,从而形成一个云上的安全域。
19726 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
11998 0
+关注
wsc449
python,c#,scala
232
文章
4
问答
文章排行榜
最热
最新
相关电子书
更多
JS零基础入门教程(上册)
立即下载
性能优化方法论
立即下载
手把手学习日志服务SLS,云启实验室实战指南
立即下载