云计算与大数据期末考试题库(二)

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 云计算与大数据期末考试题库(二)

37.云计算就是把计算资源都放到上(B )

   A、对等网

   B、因特网

   C、广域网

   D、无线网

38.数据存储单位从小到大排列顺序是 C

   A、EB 、PB、YB、ZB

   B、PB、EB、YB、ZB

   C、PB、EB、ZB、YB

   D、YB、ZB、PB、EB

39. 虚拟化资源指一些可以实现一定操作具有一定功能,但其本身是( A)的资源,如计算池,存储池和网络池、数据库资源等,通过软件技术来实现相关的虚拟化功能包括虚拟环境、虚拟系统、虚拟平台。

   A、虚拟

   B、真实

   C、物理

   D、实体

40、微软于2008年10月推出云计算操作系统是(C)

   A、GoogleAppEngine

   B、蓝云

   C、Azure

   D、EC2

41.云计算体系结构的(C)负责资源管理、任务管理用户管理和安全管理等工作

   A、物理资源层

   B、资源池层

   C、管理中间件层

   D、SOA构建层

42.( D)在许多情况下,能够达到99.999%的可用性。

   A、虚拟化

   B、分布式

   C、并行计算

   D、集群

43、云计算里面面临的一个很大的问题,就是(D)。

   A、服务器

   B、存储

   C、计算

   D、节能

44、云计算技术的研究重点是(B)

A服务器制造。B将资源整合。C网络设备制造。D数据中心制造

45、网页 QQ 属于(A)。

A.SaaS   B.IaaS  C.PaaS   D.VaaS

Hive 是建立在_C__之上的一个数据仓库?

A hdfs  B  MapReduce  C  Hadoop  D  HBase

46、FusionInsight HD 系统中HBase 的最小处理单元是

Region ,User Region 和RegionService 之间的路由信息是保

存在哪?(D)

A. Zookeeper ; B. HDFS;   C. Master ;  D. meta 表;

47、下列哪个HDFS 命令可用于检测数据块的完整性?(A)

A.hdfs fsck /;  B.hdfs fsck / -delete;

C.hdfs dfsadmin -report;   D.hdfs balancer -threshold 1;

48、下列哪个程序通常与NameNode在一个节点启动?(D)

A:SecondaryNameNode   B:DataNode

C:TaskTracker            D:Jobtracker

49、关于SecondaryNameNode哪项是正确 的?(C)

A它是NameNode的热备

B 它对内存没有要求

C 它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间

D SecondaryNameNode应与NameNode部署到一个节点

50 、一个gzip文件大小75MB,客户端设置Block大小为64MB,请我其占用几个Block? (B)

A 1    B 2    C 3     D 4

51. 下列不属于OpenStack 组件的是( D)。

A. Keystone  B. Nova  C. Glance  D.MapReduce

52. 关于云计算的表述错误的是( B)。

A. 云计算是通过网络按需向用户提供IT 基础设施服务 B. 在云中,所有资源都可以通过纵向进行扩展

C. 云计算是服务的交付和使用模式  D. 云计算是一种能够提供可便捷获取所需资源的模型

53、OpenStack中提供认证管理服务的组件是( C )

A、Cinder B、Nova  C、Keystone   D、Neutron

54. 下列(C)不是Nova 具有的功能。

A. 实例生命周期管理 B. 计算资源管理  C. 镜像内容管理  D. 基于REST 的API

55. MapReduce 编程模型对数据流的处理过程包含以下流程:

① Splitting ② Shuffling ③ Input ④ Mapping ⑤ Reducing 其中顺序正确的是(B )。

A. ①③②④⑤  B. ③①④②⑤  C. ②⑤③①④  D. ④⑤①③②

56. 关于hadoop 的描述错误的是(C )。

A. Hadoop 是一款开源软件,实现了分布式文件系统功能

B. Hadoop 具有低成本、高扩展性、高效性、高容错性等特点

C. Hadoop 扩展新的节点后,需重载所有节点后生效

D. Hadoop 将计算任务动态分配到集群中各个节点,并保证各节点动态平衡

57. 关于HDFS 描述错误的是( C)。

A.HDFS 实现了对分布式存储的底层支持,可高速读写数据

B.HDFS 可根据需求进行水平扩展

C.HDFS 在MapReduce 任务处理过程中提供了目录的访问和存储的支持

D. HDFS 与MapReduce 相互协作共同完成hadoop 分布式集群主要任务

58. 下列(A )不属于HDFS 存在的缺点。

A. 可处理大量数据,具有高吞吐量  B. 时间延迟相对较高

C. 存储小文件成本过高  D. 同一时间只支持一个用户写入

59. 下列( B)不属于Hadoop 部署模式。

A. 单机模式B. 双机模式C. 伪分布式D. 完全分布式

60. 下列关于HBase 的描述错误的是(B)。

A. HBase 可以与Hadoop 更好的整合在一起  B. HBase支持表间的join操作等操作

C. HBase 的每一次操作都有时间戳标记  D. HBase 是基于列存储的类型

61. 下列( C)不属于OpenStack 具有的优势。

A. 兼容性  B. 可扩展性  C. 易安装性  D. 灵活性

62、OpenStack中提供镜像注册服务的组件是( B )

A、Swift  B、Glance  C、Nova  D、Cinder

63、OpenStack中提供计算服务的组件是( B )

A、Neutron  B、Nova  C、Swift  D、Glance

64、Hive默认的构造是存储在(install-dir)/conf/__(B )

A.hive-core.xml

B.hive-default.xml

C.hive-site.xml

D.hive-lib.xml

65、Hive 是建立在__C_之上的一个数据仓库?

A.hdfs   B.MapReduce  C.hadoop   D.HBase

66、为了启动 hive,我们必须在路径里安装有 hadoop 或者A__?

A.export HADOOP_HOME=hadoop-install-dir

B.export HIVE_HOME=hive-install-dir

C.export JAVA_HOME=java-install-dir

D.export HDFS_HOME=hdfs-install-dir

67、对于最小粒度的任务,Hive 查询的反应时间约为 _D__?

A.几微秒  B.几毫秒  C.几秒  D.几分钟

68、下面的哪个版本的 Hadoop 在其安装目录里集成了 Hive __D_?

A.Hadoop-0.18.1  B.Hadoop-0.18.2  C.Hadoop-0.19.1  D.Hadoop-0.20.1

69、Hive 查询语言中的算术操作符的返回结果是__A_类型的?

A.Number   B.Int   C.Bigint   D.String

70、Hive 最重视的性能是可测量性,延展性,_B_和对于输入格式的宽松匹配性?

A 较低恢复性

B 容错性

C 快速查询

D 可处理大量数据

71、Hadoop中,___执行文件系统命名空间操作 B

A Datanode

B Namenode

C JobTracker

D TaskTracker

判断题

  1. MapReduce与HBase两者不是强关联关系,没有MapReduce,HBase可以正常运行,MapReduce可以直接访问HBase(正确)
  2. 如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。( 错 )
  3. Hadoop是Java开发的,所以MapReduce只支持Java语言编写。(  错)
  4. Slave节点要存储数据,所以它的磁盘越大越好。( 错 )
  5. Hadoop默认调度器策略为FIFO,并支持多个Pool提交Job。( 错 )
  6. 因为HDFS有多个副本,所以NameNode是不存在单点问题的。( 错 )
  7. Mapreduce的input split就是一个block。(  错)
  8. Kerberos 仅用于组建间服务安全认证。(答案:错误)
  9. 安装数据平台软件包前,必须在本节点/etc/hosts文件中配置所有节点的主机名与业务ip 的映射关系。(答案:正确)
  10. 云计算是从网格计算演化而来的,能够随需应变地提供资源。 标准答案:对
  11. 云计算的消费者需要管理或控制云计算的基础设施,例如网络,操作系统、存储等。 标准答案:错
  12. PaaS实质是将互联网的资源服务化为可编程接口。对。
  13. 采用空气冷却的数据中心通常建在较高的维度上。对。
  14. 全虚拟化同时能够支持多个不同的操作系统。对。
  15. 分布式文件系统基本上都有冗余备份机制和容错机制来保证数据读写的正确性。对。
  16. 云计算的硬件主要部署于数据中心。对。
  17. 低功耗芯片是将来云计算芯片的主流,将是云计算芯片的主流发展方向。对。
  18. 工信部已在北京、上海、杭州、深圳、无锡、哈尔滨等多个城市开展云计算服务创新试点工作。(对)
  19. “云计算:是基于互联网的服务的增加、使用交付模式, 通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。” 标准答案:true
  20. 云计算产业的发展瞬息万变,具有强大的活力,这种不确定性也是战略性新兴产业的特征。 标准答案:true
  21. 云计算是一种计算模式,能够提供随时随地的、便捷的、随需应变的网络接入,访问可配置的 计算资源共享池。 标准答案:true
  22. 智慧旅游平台可以通过采集汇总客户相关数据,综合分析景区旅游游客来源及行程轨迹特征,实时统计游客流量信息。(  正确  )
  23. 互联网就是一个超大云(正确 )
  24. 高德地图使用大数据能进行小路的识别。 正确
  25. 大数据仅仅是指数据的体量大。错误
  26. 大数据的数据格式为结构化数据。错误
  27. 数据清洗就是去除重复记录。错误
  28. PIG是脚本语言,它与mapreduce无关。(错)
  29. 集群内每个节点都应该配RAID,这样避免单磁盘损坏,影响整个节点运行。(错  )
  30. 因为HDFS有多个副本,所以NameNode是不存在单点问题的。(  错)
  31. Hadoop支持数据的随机写。( 错 )
  32. NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读取或则会写入metadata信息并反馈client端。(  错)
  33. Block Size 是不可以修改的。(错误 )
  34. Slave 节点要存储数据,所以它的磁盘越大越好。( 错误)
  35. Hadoop 默认调度器策略为 FIFO(正确 )
  36. 数据库都使用SQL语言作为操作语言(错)
  37. standalone(集群模式)典型的Mater/slave模式,Master可能有单点故障的;Spark⽀持ZooKeeper来实现 HA。(正确)

简答题

1.请简要说明大数据技术

答:“大数据”就是海量数据的集合,而大数据技术就是采集、分析、处理这些庞大数据信息,应用到生活中。大数据技术主要包含以下技术:大数据收集、大数据的存储、大数据的清洗、大数据的查询分析、大数据可视化分析、大数据挖掘、模型预测、结果呈现等技术。

2.简述大数据的特征(5V 特征)

(1)数据体量(Volume)巨大,指收集和分析的数据量非常大,从TB 级别跃升至PB级别;

(2)处理速度(Velocity)快,需要对数据进行近实时的分析;

(3)数据类别(Variety)大,大数据来自多种数据源,数据种类和格式日渐丰富,包括结构化、半结构化和非结构化等多种数据形式;

(4)数据真实性(Veracity),大数据的内容是与真实世界中的发生息息相关的,研究大数据就是从庞大的网络数据中提取能够解释和预测现实事件的过程。

(5)价值密度低,商业价值(Value)高,通过分析数据可以得出如何抓住机遇及收获价值。

3.简述云计算概念及特点

云计算是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序。

云计算的特征:超大规模、虚拟化、高可靠性、高可伸缩性、按需服务、极其廉价等特征。

4.简述云计算服务模型的分类及各类的定义。

云计算模型中包括IaaS(基础架构即服务)、PaaS(平台即服务)和SaaS(软件即服务)。

IaaS 提供最底层的IT 基础设施服务,包括处理能力、存储空间、网络资源等,用户可

以从中获取硬件或虚拟硬件资源,可以给申请到的资源安装操作系统和其他应用程序。

PaaS 是把已经安装好开发环境的系统平台作为一种服务通过互联网提供给用户。用户

可以在上面安装其他应用程序,但不能修改已经安装好的操作系统和运行环境。

SaaS 可直接通过互联网为用户提供软件和应用程序的服务。用户可以通过租赁的方式

获取安装在厂商或者服务供应商那里的软件。

5.简述Hadoop集群可以运行的3个模式?

单机(本地)模式,伪分布式模式和全分布式模式三种。

Hadoop的三种运行模式 :

单机(本地)运行模式:无需任何守护进程,所有的程序都运行在同一个JVM上执行,调试MR程序非常高效方便,主要是在学习或者开发阶段调试使用。

伪分布式模式: Hadoop守护进程运行在本地机器上,模拟一个小规模的集群,伪分布式是完全分布式的一个特例。

全分布式模式:Hadoop守护进程运行在一个集群上。通常被用于生产环境。

6.简述Hadoop核心组件及功能

1)Hadoop通用组件(Hadoop Common):包含了其他hadoop模块要用到的库文件和工具。

2)分布式文件系统(Hadoop Distributed File System,HDFS):运行于通用硬件上的分布式文件系统,高吞吐,高可靠。

3)资源管理组件(Hadoop YARN):用于管理集群中的计算资源并在这些资源上调度用户应用。

4)分布式计算框架(Hadoop MapReduce):用于处理超大数据集计算的MapReduce编程模型的实现。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
2月前
|
存储 弹性计算 分布式计算
云计算在大数据处理中的优势与挑战
云计算在大数据处理中的优势与挑战
|
2月前
|
存储 人工智能 大数据
物联网、大数据、云计算、人工智能之间的关系
物联网、大数据、云计算、人工智能之间的关系是紧密相连、相互促进的。这四者既有各自独立的技术特征,又能在不同层面上相互融合,共同推动信息技术的发展和应用。
870 0
|
3月前
|
算法 大数据 数据库
云计算与大数据平台的数据库迁移与同步
本文详细介绍了云计算与大数据平台的数据库迁移与同步的核心概念、算法原理、具体操作步骤、数学模型公式、代码实例及未来发展趋势与挑战。涵盖全量与增量迁移、一致性与异步复制等内容,旨在帮助读者全面了解并应对相关技术挑战。
71 3
|
5月前
|
分布式计算 并行计算 大数据
【数据挖掘】百度2015大数据云计算研发笔试卷
百度2015年大数据云计算研发笔试卷的题目总结,涵盖了Hadoop、Spark、MPI计算框架特点、TCP连接建立过程、数组最大和问题、二分查找实现以及灯泡开关问题,提供了部分题目的解析和伪代码。
62 1
|
2月前
|
存储 安全 网络安全
云计算与网络安全的深度探讨###
【10月更文挑战第21天】 云计算作为信息技术领域的重要组成部分,正在迅速改变我们的工作方式和生活模式。然而,随着云服务的普及,网络安全问题也日益凸显。本文将详细探讨云计算的基本概念、服务模型及其对网络安全的影响,并深入分析数据保护、身份与访问管理、应用程序安全等关键技术领域的最新进展。通过实际案例和技术手段,展示如何在云计算环境下实现全面的安全防护。最后,对未来网络安全的发展进行展望,提供一些启示和建议。 ###
67 5
|
1月前
|
存储 安全 网络安全
云计算与网络安全:技术融合的双刃剑
在数字化浪潮中,云计算如同一股不可阻挡的力量,推动着企业和个人用户步入一个高效、便捷的新时代。然而,随之而来的网络安全问题也如影随形,成为制约云计算发展的阿喀琉斯之踵。本文将探讨云计算服务中的网络安全挑战,揭示信息保护的重要性,并提供实用的安全策略,旨在为读者呈现一场技术与安全的较量,同时指出如何在享受云服务带来的便利的同时,确保数据的安全和隐私。
36 6
|
1月前
|
存储 人工智能 安全
云计算与网络安全:技术融合与挑战
在数字化时代的浪潮中,云计算和网络安全已成为推动社会进步的两大关键技术。本文将探讨云计算服务的发展,网络安全的重要性,以及信息安全技术的演进。我们将通过实例分析,揭示云服务如何增强数据保护,网络安全措施如何应对新兴威胁,以及信息安全技术的创新如何为企业带来竞争优势。文章旨在为读者提供对云计算和网络安全领域的深入理解,并展示它们如何共同塑造我们的未来。
|
1月前
|
监控 安全 网络安全
云计算与网络安全:技术挑战与解决方案
随着云计算技术的飞速发展,其在各行各业的应用越来越广泛。然而,随之而来的网络安全问题也日益凸显。本文将从云服务、网络安全和信息安全等技术领域出发,探讨云计算面临的安全挑战及相应的解决方案。通过实例分析和代码示例,旨在帮助读者更好地理解云计算与网络安全的关系,提高网络安全防护意识。
|
1月前
|
存储 安全 网络安全
云计算与网络安全:探索云服务的安全挑战与策略
在数字化的浪潮下,云计算成为企业转型的重要推手。然而,随着云服务的普及,网络安全问题也日益凸显。本文将深入探讨云计算环境下的安全挑战,并提出相应的防护策略,旨在为企业构建安全的云环境提供指导。