31.Hadoop底层会维护多个数据副本,当某个节点出现故障后,也不会造成损失。上述文字体现了Hadoop的哪个特点?(C)
A:高效率
B:低成本
C:高可靠
D:高扩展
解析:“当某个节点出现故障后,也不会造成损失”体现了高可靠的特点
32.HBase的服务体系与Hoodoop类似也遵从的是主从结构,以下选项中那个是HBase的主节点(B)
A:HRegionServer
B:HMaster
C:Hregion
D:MemStore
解析:主节点Hmaster
33.大数据的特征,由维克托迈尔-舍恩伯格和肯尼斯克耶编写的《大数据时代》中提出,下哪一个描述大数据的4V特征是错误的?"(C)
A:Volume规模性
B:Velocity数据变化快
C:Value单位数据价值密度高
D:Variety数据类型多
解析:大数据的4v特征主要包含规模性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value) Value(价值密度低)
34.在NoSQL类型的数据库中,最适合用于批量处理和即时查询的是什么数据库?(D)
A:关系型数据库
B:文档型数据库
C:图形型数据库
D:列族数据库
解析:列存储:主要适合与批量数据处理和即时查询
35.数据清洗是指检测和纠正错误数据,它清洗的内容包含(ABC)
A:缺失值处理
B:异常值处理
C:数据类型转换
D:精确度检验
解析:数据清洗的内容包括:缺失值处理、数据类型转换、异常值处理以及数据排序
36.智能健康手环数据收集,体现了(D)的数据采集技术的应用。
A:USB数据传输
B:网络数据
C:API接口
D:传感器设备
解析:“智能健康手环”体现了传感器设备的应用
37.Hive的SQL执行流程中Physical Plan Generator的作用是什么?(C)
A:生成查询语句
B:编译SQL语句
C:将逻辑查询计划转化为物理计划
D:分析查询条件
解析:将逻辑查询计划转成物理计划(physical plan generator)
38.在MaxCompute架构中,关于计算引擎说法正确的是(A)
A:MaxCompute能处理离线数据与实时数据是一个流批一体的计算框架
B:MaxCompute计算引擎是依赖Hadoop平台
C:MaxCompute不支持Spark
D:MaxCompute SQL支持事务、索引
解析:链接:https://help.aliyun.com/document_detail/27800.html、 https://help.aliyun.com/document_detail/102357.html 计算引擎 MaxCompute本身具备计算引擎能力。 MaxCompute支持社区原生Spark、完全兼容Spark的API,同时支持多个Spark版本同时运行。 MaxCompute SQL不支持事务、索引。
39.商业上要求个性化推荐算法达到实时推荐的效果,如:某网站刚刚发布的新闻或视频,用户可以在几分钟甚至更短的时间内搜索到。体现了大数据的(C)特征。
A:Volume规模性
B:Veracity准确性
C:Velocity高速性
D:Varlety多样性
E:Value价值性
解析:“用户可以在很短时间内搜索到”体现了高速性
40.传感器数据源有哪些应用场景? (AC)
A:手机支付宝运动监测运动步数
B:优酷网播放的视频
C:智能穿戴记录睡眠情况
D:ERP系统的存储数据
解析:传感器数据源以OpenTelemetry为核心,支持各类数据形态、设备/端、数据格式的采集,覆盖面足够“广”。