阿里云大数据ACA及ACP复习题(311~320)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云解析 DNS,旗舰版 1个月
简介: 本人备考阿里云大数据考试时自行收集准备的题库,纯手工整理的,能够覆盖到今年7月份,应该是目前最新的,发成文章希望大家能一起学习,不要花冤枉钱去买题库背了,也希望大家能够顺利通关ACA和ACP考试。

311.小明在一家IT教育公司做运营工作,经常听到同学聊到MaxCompute核心概念,但又不知其意,下列哪些选项( ABCDE )能帮助小明更好的了解MaxCompute。
A:Project(项目)项目是MaxCompute的基本组织单元,类似于传统数据库的Database或Schema的概念,是进行多用户隔离和访问控制的主要边界
B:Partition(分区)分区Partition是指一张表下,根据分区字段(一个或多个字段的组合)对数据存储进行划分
C:View(视图)视图是在表之上建立的虚拟表,它的结构和内容都来自表。一个视图可以对应一个表或多个表
D:Role(角色)角色是MaxCompute安全功能中的概念,可以理解为拥有相同权限的用户的集合。多个用户可以同时存在于一个角色下,一个用户也可以隶属于多个角色
E:Resource(资源)资源是MaxCompute中特有的概念。当使用MaxCompute的自定义函数(UDF)或MapReduce功能时,需要依赖资源来完成。
F:odpscmd-MaxCompute的命令行客户端,适用于任意场景,用户可以专注于编写命令完成数据处理。

解析:MaxCompute具有层次结构,核心包含Project(项目),Table(表),Partition(分区),View(视图),User(用户),Role(角色),Resource(资源),Function(函数),Instance(实例),Quota(配额),Quota(配额),Schema。

312.Dataworks数据管理通过数据地图功能实现对数据的统一管理和血缘跟踪,数据地图以数据搜索为基础,提供表使用说明,那么下列对于表的管理操作描述不正确的选项是( D )?
A:查找表:通过类目、项目名称、模糊查询搜索表
B:可以查看表的详情,即元数据信息
C:可以进行收藏表、申请权限、生成API等操作
D:数据管理模块中的表存储信息是实时同步的

解析:表存储信息是离线计算的、默认是一天同步一次信息

313.K-NN中可以用来做距离度量的指标是( ABC )。
A:欧氏距离
B:曼哈顿距离
C:余弦距离
D:交叉熵

解析:选项欧氏距离、曼哈顿距离、余弦距离是可用的距离参数

314.选项中关于Hadoop生态组件Pig功能的描述正确的是?( D )
A:可扩展的分布式数据库,支持大表的结构化数据存储
B:数据仓库基础架构,提供数据汇总和命令行即席查询功能
C:可扩展的机器学习和数据挖掘库
D:用于并行计算的高级数据流语言和执行框架

解析:HBase:可扩展的分布式数据库,支持大表的结构化数据存储。
Hive:数据仓库基础架构,提供数据汇总和命令行即席查询功能。
Mahout:可扩展的机器学习和数据挖掘库。
Pig:用于并行计算的高级数据流语言和执行框架。

315.在数据可视化的图表选择中,下列选项中不属于局部整体型图表的是?( D )
A:百分比堆积面积图
B:旭日图
C:沃洛诺伊图
D:散点图
E:南丁格尔玫瑰图

解析:饼图、圆环图、半圆环图、扇形图、马赛克图、南丁格尔玫瑰图、沃洛诺伊图、百分比堆积面积图、旭日图

316.进行数据清洗时,针对于不同的情况和场景需要选择不同的方法,以下对数据进行清洗的手段正确的是( ACD )
A:缺失值填充
B:集成不同的数据库
C:重复值处理
D:异常值和数据类型转换

解析:数据清洗的内容包括: 缺失值处理、异常值处理、 数据类型转换、重复值处理

317.大数据的四种计算模式解决了大数据中不同类型的数据处理问题,下列关于大数据处理分析计算模式,描述正确的是?( ABD )
A:图计算(Graph Processing)是将数据按照图的方式建模可以获得以往用扁平化的视角很难得到的结果
B:查询分析计算是针对超大规模的数据的存储管理与查询分析,需要提供实时或者准时的响应,以满足企业管理的需求
C:流计算是实时获取来自相同数据源的海量数据,经过实时分析处理,获得有价值的信息
D:批处理计算就是对某对象进行批量的处理,也称为批处理脚本,它是一种简化的脚本语言,主要是针对大规模数据的批量处理

解析:流计算:实时获取来自不同数据源的海量数据经过实时分析处理,获取有价值的信息。

318.Quick BI数据可视化分析平台提供了丰富的组件,以下选项中哪些属于Quick BI的组件? ( ACDE )
A:指标
B:存储
C:趋势
D:比较
E:表格

解析:阿里云QuickBI数据可视化分析平台提供了8种主要组件,比较、趋势、表格、指标、时序、空间、关系和分布,每个组件都有自己的适用场景和独特优势

319.下列选项中,分布式数据库系统特点不包括( D )
A:独立透明性
B:集中节点结合
C:易于扩展性
D:半透明性

解析
分布式数据库系统的特点:
1、独立透明性;
2、集中节点结合;
3、复制透明性;
4、易于扩展性。

320.平滑处理有哪些处理方式?( ABC )
A:分箱
B:回归
C:聚类
D:分类

解析:平滑处理旨在帮助去掉数据中的噪声,常用的方法包括分箱、回归和聚类等。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6天前
|
存储 人工智能 分布式计算
阿里云智能大数据演进
本文根据7月24日飞天发布时刻产品发布会、7月5日DataFunCon2024·北京站:大数据·大模型.双核时代实录整理而成
|
17天前
|
存储 运维 Cloud Native
"Flink+Paimon:阿里云大数据云原生运维数仓的创新实践,引领实时数据处理新纪元"
【8月更文挑战第2天】Flink+Paimon在阿里云大数据云原生运维数仓的实践
180 3
|
22天前
|
存储 分布式计算 定位技术
高德地图与阿里云MaxCompute:构建智慧出行的数据引擎
通过与阿里云MaxCompute的紧密结合,高德地图成功构建了一个高效、稳定的大数据处理平台,实现了从数据采集到价值输出的全过程自动化。这不仅提升了数据处理效率,还极大地改善了用户体验,为智慧出行的发展奠定了坚实的基础。随着技术的不断进步,未来高德地图还将探索更多创新的应用场景,持续推动地图服务向智能化方向演进。
|
22天前
|
存储 SQL 机器学习/深度学习
阿里云数加大数据计算服务MaxCompute学习路线图:从入门到精通
将所学知识应用于实际工作中并不断进行实践和创新是提升技术能力的关键所在。用户可以结合业务需求和技术发展趋势积极探索新的应用场景和解决方案,并在实践中不断总结经验和教训以提升自己的技术水平和实践能力。
|
1月前
|
分布式计算 DataWorks 大数据
MaxCompute产品使用合集之在阿里云DataWorks中,如何关闭跨空间查询表功能
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
1月前
|
机器学习/深度学习 运维 算法
|
3天前
|
机器学习/深度学习 编解码 人工智能
阿里云gpu云服务器租用价格:最新收费标准与活动价格及热门实例解析
随着人工智能、大数据和深度学习等领域的快速发展,GPU服务器的需求日益增长。阿里云的GPU服务器凭借强大的计算能力和灵活的资源配置,成为众多用户的首选。很多用户比较关心gpu云服务器的收费标准与活动价格情况,目前计算型gn6v实例云服务器一周价格为2138.27元/1周起,月付价格为3830.00元/1个月起;计算型gn7i实例云服务器一周价格为1793.30元/1周起,月付价格为3213.99元/1个月起;计算型 gn6i实例云服务器一周价格为942.11元/1周起,月付价格为1694.00元/1个月起。本文为大家整理汇总了gpu云服务器的最新收费标准与活动价格情况,以供参考。
阿里云gpu云服务器租用价格:最新收费标准与活动价格及热门实例解析
|
6天前
|
云安全 弹性计算 安全
阿里云服务器基础安全防护简介,云服务器基础安全防护及常见安全产品简介
在使用云服务器的过程中,云服务器的安全问题是很多用户非常关心的问题,阿里云服务器不仅提供了一些基础防护,我们也可以选择其他的云安全类产品来确保我们云服务器的安全。本文为大家介绍一下阿里云服务器的基础安全防护有哪些,以及阿里云的一些安全防护类云产品。
阿里云服务器基础安全防护简介,云服务器基础安全防护及常见安全产品简介
|
5天前
|
机器学习/深度学习 弹性计算 人工智能
阿里云第八代云服务器ECSg8i实例深度解析:性能及适用场景参考
目前企业对云服务器的性能、安全性和AI能力的要求日益提高。阿里云推出的第八代云服务器ECS g8i实例,以其卓越的性能、增强的AI能力和全面的安全防护,除了适用于通用互联网应用和在线音视频应用等场景之外,也广泛应用于AI相关应用。本文将深入解析ECS g8i实例的技术特性、产品优势、适用场景及与同类产品的对比,以供参考。
阿里云第八代云服务器ECSg8i实例深度解析:性能及适用场景参考
|
18天前
|
弹性计算 运维 搜索推荐
阿里云建站方案参考:云服务器、速成美站、企业官网区别及选择参考
随着数字化转型的浪潮不断推进,越来越多的企业和公司开始将业务迁移到云端,而搭建一个专业、高效的企业官网成为了上云的第一步。企业官网不仅是展示公司形象、产品和服务的重要窗口,更是与客户沟通、传递价值的关键渠道。随着阿里云服务器和建站产品的知名度越来越高,越来越多的用户选择阿里云的产品来搭建自己的官网。本文将深入探讨在阿里云平台上,如何选择最适合自己的建站方案:云服务器建站、云·速成美站还是云·企业官网。
103 13
阿里云建站方案参考:云服务器、速成美站、企业官网区别及选择参考

热门文章

最新文章