451.某超市通过分析顾客的购买记录后发现,购买纸尿裤的人由较大的概率也会购买啤酒,这个案例数据大数据分析的哪种类型的问题? ( D )
A:聚类
B:时序分析
C:分类
D:关联分析
解析:典型的数据挖掘中的关联分析案例
452.关于DataWorks运维中心智能监控的基线报警,以下说法错误的是?( D )
A:每个基线都必须提供预警余量
B:当智能监控预测基线的完成时间超过预警余量时,会直接通知设置的报警对象3次
C:当智能监控预测基线的完成时间超过预警余量时,报警每次间隔30分钟。
D:每个基线都必须提供延时时间
解析:基线报警是针对已经开启基线开关的基线的一个附加功能,每个基线都必须提供预警余量和承诺时间; 当智能监控预测基线的完成时间超过预警余量时,会直接通知设置的报警对象3次,每次间隔30分钟。 不涉及延时时间设置
453.机器学习PAI(Platform of Artificial Itelligence)是阿里云人工智能平台,提供一站式的机器学习解决方案。以下哪个不属于机器学习平台PAI的基础设施?( C )
A:CPU集群
B:GPU集群
C:自建集群
D:FPGA集群
解析:PAI的基础硬件包括CPU/GPU/NPU/FPGA
454.大数据存储一般采用的是分布式存储技术,以下关于分布式存储说法正确的是?( C )
A:Hadoop的分布式存储技术是GFS
B:分布式存储要求底层有多台高性能存储服务器
C:分布式存储实现数据冗余,提高了数据的安全性
D:分布式存储方式无法存储传统的结构化数据
解析:Hadoop的分布式存储技术是HDFS;分布式存储不要求底层服务器高性能,多台服务器同时提供服务;冗余存储,副本技术,保障数据安全;分布式存储Hive即为结构化存储
455.DataWorks基于( ABCDF )等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。
A:MaxCompute、
B:Hologres
C:AnalyticDB
D:EMR
E:Hadoop
F:CDP
解析:DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。
456.在信息爆炸的时代,越来越多的数据堆积,这些密集数据没有重点关注并可读性较差,因此,我们需要数据可视化,以帮助数据易于理解和接受,那么下列关于数据可视化常用图表应用场景描述正确的有( ABDEF)。
A:条形图主要应用于数据比较(类别名称可以更长,因为Y轴上有更多空间)
B:柱状图主要应用于分类数据比较
C:饼状图主要应用于多个数据系列比较
D:散点图主要应用于关联分析,数据分发
E:折线图主要应用于数据量随时间变化的趋势,系列趋势的比较
F:面积图主要应用于序列比,时间趋势比
解析:饼状图广泛用于各个领域,以表示不同类别的比例,并通过弧线比较各种类别。 饼形图不适用于多个数据系列,因为随着数据系列的增加,每个切片将变得更小,最后大小区别也不明显。饼图也可以制成多层饼图,显示不同类别数据的比例,同时也反映层次关系。主要应用场景序列比率,序列大小比较(玫瑰图)
457.文件系统是计算机中管理文件的程序,以下哪些选项是文件系统的功能?( ABD )
A:新建文件
B:存储文件
C:存储结构化的数据
D:提供文件的检索
解析:文件保护与检索、实现文件按名存取、管理存储介质、划分分区。
458.Hive是构建在Hadoop上的数据仓库框架,关于Hive的描述正确的是?( C )
A:Hive的本质是将MapReduce转化成HQL程序,然后进一步提交给Hadoop框架执行
B:不依赖分布式并行计算模型MapReduce处理数据
C:定义了简单的类SQL查询语言HiveQL,用户可以通过编写的HiveQL语句运行MapReduce任务
D:不依赖分布式文件系统HDFS存储数据
解析:Hive的本质是将HQL转换成MapReduce程序,然后提交给Hadoop框架执行; Hive 依赖分布式并行计算模型MapReduce 处理数据; Hive定义了简单的类似SQL 的查询语言HiveQL。 用户可以通过编写的HiveQL语句运行MapReduce任务; Hive 依赖分布式文件系统HDFS存储数据;
459.在天气预报中的降雨量地图中,根据颜色不同来反映不同区域的降水量。这是数据可视化在( C )学科上的应用?
A:科学可视化
B:信息可视化
C:可视化分析学
D:空间可视化
解析:“根据颜色不同来反映不同区域的降水量”可视化分析学
460.数据挖掘中常见的分类算法有哪几种?( ABC )
A:决策树
B:朴素贝叶斯
C:支持向量机
D:循环神经网络
解析:数据挖掘中常见的分类算法有决策树算法、贝叶斯分类算法、支持向量机。