171.下列哪项属于数据仓库的功能?( C )
A:根据存储的实时数据,生成新的有应用价值的数据
B:永久存储数据,做数据查询
C:是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合
D:历史数据存储备份使用
解析:数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
数据仓库数据当然可以永久存储,但意义不大,一般都具备数据的生命周期 数据仓库主要解决的是离线数据存储 数据仓库具备备份功能,但并不是存储历史数据并进行备份的
172.随着大数据时代的发展,Hadoop生态圈组件越来越丰富。关于Hadoop组件YARN是( B )
A:工作流引擎
B:资源管理系统
C:分布式计算框架
D:列式数据库
解析:https://help.aliyun.com/document_detail/440602.html YARN是一个分布式的资源管理系统。YARN是Hadoop系统的核心组件,主要功能包括负责在Hadoop集群中的资源管理,负责对作业进行调度运行以及监控。
173.数据预处理是将原始数据转换为可理解的格式的过程,数据预处理的步骤不包含的选项是?( C )
A:数据集成
B:数据清洗
C:数据脱敏
D:数据归约
E:数据变换
解析:数据预处理的四个步骤分别是数据清洗、数据集成、数据变换和数据归约。
174.Hadoop是一个由Apache基金会所开发的( B )。用户可以在不了解分布式底层细节的情况下,开发分 布式程序。充分利用集群的威力实现高速运算和存储。
A:分布式存储架构
B:分布式系统基础架构
C:分布式流式架构
D:分布式消息订阅分发的框架
解析:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
175.( A )平台供应商将应用软件统一部署在自己的服务器上,客户可以根据工作实际需求,通过互联网向供应商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用
A:Saas
B:Paas
C:laas
D:Daas
解析:SaaS平台供应商将应用软件统一部署在自己的服务器上,客户可以根据工作实际需求,通过互联网向厂商定购所需的应用软件服务,按定购的服务多少和时间长短向厂商支付费用
176.在关系型数据库中数据主要以行与列的形式存储在关系表中,以下关于关系表描述正确的是?( B )
A:关系表数据是线性存储的
B:关系表可以看成一张二维表格
C:关系表是按Key—Value进行存储的
D:以上都不对
解析:关系表可以看成一张二维表格
177.海量的数据存储是大数据应用中面临的重要问题,下面哪项技术或产品能解决海量数据存储问题( D )
A:阿里云的RDS MysQL数据库
B:单机Redis数据库
C:本地MysQL数据库
D:分布式文件系统
解析:分布式文件存储
178.阿里云大数据体系中,能提供离线和流式数据的接入,完成计算服务的是( C )。
A:Quick BI数据可视化分析平台
B:云原生数据仓库(分析型数据库)AnalyticDB
C:大数据计算服务MaxCompute
D:数据工场DataWorks
解析:MaxCompute提供离线和流式数据的接入,支持大规模数据计算及查询加速能力,为您提供面向多种计算场景的数据仓库解决方案及分析建模服务。 https://help.aliyun.com/document_detail/27800.html?spm=a2c4g.28068.0.i9
179.Hive是基于Hadoop的一个( B )的工具,用于查询和管理在分布式存储系统中的大型数据集。
A:关系型数据库
B:数据仓库
C:非关系型数据库
D:数据库
解析:hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
180.机器学习流程的顺序是: 1. 特征提取 2. 模型训练 3.模型测试 4.数据清洗 ( C )
A:1234
B:2341
C:4123
D:4321
解析:4123是正确的流程