91.根据颜色的不同来反映不同区域的降水量,这是数据可视化在什么学科上的应用?(C)
A:区域地理学
B:可视性分析学
C:空间可视化
D:信息学
解析:“根据颜色不同来反映不同区域的降水量”体现了空间可视化
92.下列关于HDFS的描述,正确的有?(A)
A:Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)分布式文件系统,完成数据分布式存储,具有高容错性和可扩展性的特点
B:是一种通过网络实现文件在多台主机上进行存储的文件系统,但数据安全性不能得到保证
C:分布式文件系统都是采用“客户机/服务器"一主多从
D:谷歌开发了分布式文件系统HDFS
解析:HDFS(Hadoop Distributed File System) Hadoop分布式文件系统,适合运行在通用硬件上做分布式存储和计算 Hadoop是Apache Lucene创始人Doug Cutting开发的使用广泛的文本搜索库。它起源于Apache Nutch,后者是一个开源的网络搜索引擎,本身也是Luene项目的一部分。Aapche Hadoop架构是MapReduce算法的一种开源应用,是Google开创其帝国的重要基石。 GFS(Google File System):Google公司为满足公司需求而开发的基于Linux的可扩展的分布式文件系统
93.下列选项中符合数据挖掘概念的是(D)?
A:将异构数据源的数据汇集在一起
B:从大量的数据中剔除含噪声的数据
C:数据分析就是数据挖掘,只是说法不一样,两者在广义与狭义中,表达的都是同一个意思
D:从大量的数据中通过算法搜索隐藏于其中信息的过程
解析:数据分析和数据挖掘本质上来说其实并不冲突,两者可以说的上是相辅相成的。 数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。
94.Sqoop是Hadoop生态圈组件中的什么?(C)
A:数据分析工具
B:数据库引擎
C:ETL工具
D:BI工具
解析:Sqoop是一款apache旗下的“hadoop和关系型数据库数据传输”工具。
95.HBase是一个分布式的、面向列的开源数据库,源于( A )的一篇论文《BigTable:一个结构化数据的分布式存储系统》
A:Google
B:Oracle
C:Apache
D:Microsoft
解析:HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable:一个结构化数据的分布式存储系统》
96.关于网络爬虫爬取网页的步骤,包含如下哪些选项?(ABC)
A:获报网页
B:提取信息
C:保存数据
D:手动提取
解析:获取网页、解析网页以及存储数据
97.Hadoop是当前最流行的大数据分布式基架构,它提供了许多与大数据相关的核心功能,并支持许多核心项目。下列选项中,属于Hadoop核心组件的是?(D)
A:Ambari(安装、部署、配置、管理工具)
B:Oozle(作业流调度系统)
C:Hive数据仓库
D:MapReduce分布式计算框架
解析:Hadoop的核心组件为:HDFS、MapReduce和Yarn。
98.在Spark 架构中,负责SQL解析的组件是?(A)
A:SQL Parser
B:Cache Mgr
C:catalyst
D:Execution
解析:SparkSqlParser: SparkSQL的sqlParser,将SQL解析为LogicalPlan
99.网络爬虫是一种通过既定规则,自动抓取网页信息的程序,它的常见分类有(ABCD)。
A:通用网络爬虫
B:聚集网络爬虫
C:增量式网络爬虫
D:深层网络爬虫
E:随机型爬虫
解析:网络爬虫按照系统结构和实现技术,大致可以分为以下几种类型:通用网络爬虫(General Purpose Web Crawler)、聚焦网络爬虫(Focused Web Crawler)、增量式网络爬虫(Incremental Web Crawler)、深层网络爬虫(Deep Web Crawler)。实际的网络爬虫系统通常是几种爬虫技术相结合实现的。
100.阿里云实时数仓Hologres属于阿里云大数据产品体系中的哪一类产品?(A)
A:大数据计算与分析
B:大数据工具与服务
C:大数据分析与可视化
D:智能搜索与推荐
解析:链接:https://help.aliyun.com/document_detail/113648.html Hologres。致力于高性能、高可靠、低成本、可扩展的实时计算引擎研发,为用户提供海量数据的实时数据仓库解决方案和亚秒级交互式查询服务,广泛应用在实时数据中台建设、精细化分析、自助式分析、营销画像、人群圈选、实时风控等场景。