431.随着数据爆炸式增长,传统数据体系结构已经难以有效的处理大量数据集的数据。主要是因为大数据( ABC )
A:体量大
B:来源多样
C:生成极快
D:变化周期慢
E:多变
解析:大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)
432.以下哪些是关系型数据库?( B )
A:MongoDB
B:DB2
C:Redis
D:NoSQL
解析:DB2是美国IBM公司开发的一套关系型数据库管理系统。
433.数据仓库可以存储多个数据源的数据,对数据加工后产生的信息,最终用于企业的决策,以下选项中可以说明数据仓库作用的是?( ABC )
A:数据分析
B:数据挖掘
C:数据存储
D:数据应用
解析:数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
434.在数据可视化的图表选择中,下列选项中属于时间序列型图表的是?( B )
A:曲线图
B:量化波形图
C:矩形树状图
D:圆填充图
解析:量化波形图属于时间序列型图表
435.下列选项中,关于数据可视化图表类型,不属于地理空间型的是?( D )
A:简化示意图
B:分级统计地图
C:点描法地图
D:坡度图
解析:地理空间型图表: 分级统计地图、点描法地图、 带柱形地图、简单示意图
436.Apache Spark是专为大规模数据处理而设计的,下列选项中,哪些项不属于Spark的特点?( D )
A:批处理/流式数据
B:SQL分析
C:大规模数据存储
D:大规模科学计算
E:机器学习
解析:大规模科学计算不属于
437.Fume是基于流式的架构,它是一个高可用的,高可靠的数据采集工具,以下对其描述正确的是( BC )
A:Flume采集主要针对业务系统产生的日志数据进行收集
B:Flume支持日志数据采集功能
C:Flume是分布式的海量日志采集、聚合和传输的系统
D:Flume支持数据库数据采集功能
解析:Flume由Cloudera公司开发,是一个分布式、高可靠、高可用的海量日志采集、聚合、传输的系统。
438.阿里云Quick Audience 智能用户增长属于阿里云大数据产品体系中的哪一类产品?( A )
A:大数据分析与可视化
B:大数据计算与分析
C:数据开发和治理
D:大数据工具与服务
解析:属于大数据分析与可视化。
Quick Audience为您打造一站式的消费者资产管理和运营平台,通过快速的数据对接、方便的模型配置、灵活的圈选完成用户的洞察和分群,通过多渠道的链接、自动化营销链路的编排,完成用户的触达和营销策略的沉淀,提升企业消费者运营的效率,让营销更简单,更高效,更专业。
https://help.aliyun.com/document_detail/136924.html?spm=a2c4g.137900.0.0.332c722fu7qdLL
439.在DataWorks中,需要为每个项目指定一个计算引擎,即该项目中的数据存储和处理将使用该指定的计算引擎。关于计算引擎的说法中最准确的是( D )。
A:支持Hadoop MapReduce作为计算引擎
B:只能使用已创建项目的MaxCompute作为计算引擎
C:只能使用包年包月形式的MaxCompute作为计算引擎
D:支持MaxCompute、E-MapReduce、机器学习PAI等多种引擎
解析:不支持开源的MapReduce,支持E-MapReduce计算引擎 可以使用E-MR引擎 可以使用包年包月、按量付费等 dataworks为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘和探索。DataWorks支持多种计算和存储引擎服务,包括离线计算MaxCompute、开源大数据引擎E-MapReduce、实时计算(基于Flink)、机器学习PAI、图计算服务Graph Compute和交互式分析服务等,并且支持用户自定义接入计算和存储服务。
440.DataWorks项目空间的管理员角色拥有项目空间的各种管理权限,以下操作中( D )必须由拥有项目管理员角色的成员来完成。
A:创建DataWorks项目空间
B:把组织成员添加为项目成员并分配合理的角色
C:添加调度资源组
D:添加数据源
解析:项目管理员完成添加数据源,创建DataWorks项目空间,把组织成员添加为项目成员并分配合理的角色,添加调度资源组,由组织管理员完成