301.在MaxCompute SQL中可以通过CREATET ABLE语句创建一个新表,创建表时可以指定IF NOT EXISTS,以下选项中说法正确的有 ( A )
A:在创建表时不指定IF NOT EXISTS,如果不存在同名的表,则新表创建成功
B:在创建表时不指定IF NOT EXISTS,并且存在表结构不一数的同名表,此同名表将会改动表结构
C:在创建表时指定IF NOT EXISTS,并且存在同名表,则表将会被覆盖
D:在创建表时指定IF NOT EXISTS,并且存在同名表,则表将会被覆盖
解析:在创建表时,如果不存在同名表且语义正确,表创建都会返回成功。 创建表时,如果不指定if not exists选项而存在同名表,则返回出错。若指定此选项,则无论是否存在同名表,即使原表结构与要创建的目标表结构不一致,均返回成功。已存在的同名表的元信息不会被改动。
302.在MaxCompute架构中,关于数据存储方面,以下选项中说明正确的是( C )
A:Maxcompute的数据存储在文件中
B:在MaxCompute中来用了行压缩技术
C:表是Maxcompute的数据存储单元
D:优化行存默认采用AliORC压缩格式
解析:
https://help.aliyun.com/document_detail/117298.html?scm=20140722.184.2.173
表(Table)是MaxCompute的数据存储单元。
优化列存默认采用AliORC压缩格式,存储压缩比提高30%~50%
303.Hive是基于Hadoop的一个( B )的工具,用于查询和管理在分布式存储系统中的大型数据集。
A:关系型数据库
B:数据仓库
C:非关系型数据库
D:数据库
解析:hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
304.阿里云的云计算提供了多种服务模式,其中平台层使用的是 ( B )
A:Saas
B:Paas
C:laas
D:全部本地布署
解析:PAAS平台即(Platform-as-a-Service:平台即服务)
305.阿里云MaxCompute连接工具包含查询编辑器MaxCompute控制台、使用客户端(odpscmd)连接、DataWorks和MaxCompute Studio四种。其中哪一种连接工具由阿里云官方推荐且不需要手动安装?( C )
A:查询编辑器MaxCompute控制台
B:使用客户端(odpscmd)连接
C:DataWorks连接
D:MaxCompute Studio
解析:https://help.aliyun.com/document_detail/252783.html
DataWorks:不需要手动安装,基于MaxCompute项目以可视化方式实现全方位的数据开发、数据集成、数据服务等功能。当需要周期性调度作业时,推荐您使用该工具。
306.阿里云MaxCompute连接工具包含查询编辑器MaxCompute控制台、使用客户端(odpscmd)连接、DataWorks和MaxCompute Studio四种。其中哪一种需要手动安装,适用于熟悉IntelliJ IDEA工具的用户?( D )
A:查询编辑器MaxCompute控制台
B:使用客户端(odpscmd)连接
C:DataWorks连接
D:MaxCompute Studio
解析:https://help.aliyun.com/document_detail/252783.html
MaxCompute Studio:需要手动安装,基于流行的集成开发平台IntelliJ IDEA的开发插件,帮助您便捷、快速地进行数据开发。如果您可以熟练使用IntelliJ IDEA,推荐您使用该工具。
307.Hive的SQL执行流程依次为Parser、Semantic Analyzer、Logical Plan Generator、LogicalOptimizer、Physical Plan Generator、Physical Plan Optimizer。其中步骤Parser的作用是?( A )
A:将SQL转换成抽象语法树
B:将抽象语法树转换成查询块
C:将查询块转换成逻辑查询计划
D:重新逻辑查询计划
解析:Parser:将SQL解析为AST(抽象语法树)
308.MaxCompute是阿里自研的一种快速、完全托管的EB级数据仓库解决方案,以下哪个是MaxCompute的基本计算单元,并且SQL和MR都是通过其来执行的?( B )
A:实例
B:任务
C:表格
D:资源
解析:任务(Task)是MaxCompute的基本计算单元,SQL及MapReduce功能都是通过任务完成的
309.大数据面临着一些技术性难题,其中一个是海量数据的存储,目前主流的处理方式是通过( B )来解决。
A:共享存储系统
B:分布式存储系统
C:网络文件系统
D:本地文件系统
解析:大数据存储通过分布式技术,多副本存储实现海量数据稳定存储
310.DataWorks的数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。不支持下列哪一种类型的数据同步到MaxCompute?( D )
A:RDS中的数据
B:半结构化
C:结构化数据
D:OSS中存放的非结构化数据
解析:Maxcompute需要结构化和半结构化数据,非结构化数据无法同步至Maxcompute