阿里云大数据ACA及ACP复习题(51~60)

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云解析 DNS,旗舰版 1个月
简介: 本人备考阿里云大数据考试时自行收集准备的题库,纯手工整理的,能够覆盖到今年7月份,应该是目前最新的,发成文章希望大家能一起学习,不要花冤枉钱去买题库背了,也希望大家能够顺利通关ACA和ACP考试。

51.数据采集的目的需要明确,带着问题去搜集信息,使得信息采集更(A)、更有针对性。
A:高效
B:简单
C:复杂
D:一致

解析:明确采集目的,带着问题搜集信息,使信息采集更高效、更有针对性

52.年会将至,小丽需要对公司整年的运营数据做可视化汇总展示,为使可视化效果更真更美,小丽需要考虑哪些(ABDEF)因素。
A:遵循美学原则,构图美,布局美,色彩美
B:合理地构建空间感与元素的精致感
C:避免使用动画效果,影响可视化的直观感
D:数据到可视化的直观映射
E:恰当的可视化交互
F:合理的信息密度筛选

解析:动画与过渡效果可以增加可视化结果视图的丰富性与可理解性,增加用户交互的反馈效果,操作自然、连贯;还可以增强重点信息或者整体画面的表现力,吸引用户的关注力,增加印象。 但是,动画与过渡使用不当会带来适得其反的效果

53.下列关于阿里云产品理解错误的是(C)。
A:MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,基于 MaxCompute 进行数据计算与分析,将数据高效转换为业务洞察
B:开源大数据平台 E-MapReduce(简称“EMR”)是云原生开源大数据平台,可以的简单易集成部分开源大数据计算和存储引擎
C:DataV服务期内,若用户开通DataV服务使用权限的账号被阿里云等账号注册的服务方永久禁止登录的,DataV服务的使用仍然可以使用
D:DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台

解析:数据可视化DataV是阿里云一款数据可视化应用搭建工具,旨让更多的人看到数据可视化的魅力,帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用,满足会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。DataV服务期内,若用户开通DataV服务使用权限的账号被阿里云等账号注册的服务方永久禁止登录的,DataV服务的使用也将随之被终止

54.阿里云检索分析服务Elasticsearch是100%兼容开源的分布式检索、分析套件,提供Elasticsearch、Kibana、Logstash、Beats等开源全托管的产品服务能力,那么下列哪项(D)不属于Elastisearch特性。
A:读写分离、存算分离
B:弹性伸缩
C:智能化运维
D:收费的X-Pack高级商业特性

解析:阿里云检索分析服务Elasticsearch是100%兼容开源的分布式检索、分析套件。提供Elasticsearch、Kibana、Logstash、Beats等开源全托管的产品服务能力。为结构化/非结构化数据提供低成本、高性能及可靠性的检索、分析平台级产品服务。具备读写分离、存算分离、弹性伸缩、智能化运维、免费的X-Pack高级商业特性等产品特性。

55.使用Flume采集系统日志数据时,当节点出现故障后,Flume能够日志传送到其他节点上而不会丢失。这体现了Flume的哪个特点?(A)
A:可靠性
B:可扩展性
C:可管理性
D:社区活跃

解析:可靠性好: 当节点出现故障时,日志能够被传送到其他节点上而不会丢失

56.数据采集,又称数据获取,数据采集技术广泛应用在各个领域,采集的数据来源主要包含四个:(ABCD)
A:企业业务数据
B:网络数据
C:系统日志数据
D:传感器数据
E:硬件

解析:企业业务数据、网络数据、系统日志数据、传感器数据

57.关于Kafka的使用场景描述正确的是(C)。
A:Kafka是消息订阅系统,只能做消息转发
B:日志采集场景只能使用Flume工具采集
C:用户活动跟踪场景适合使用kafka框架来解决
D:Kafka是消息订阅系统,不能用于数据采集

解析:Apache Kafka是一个分布式的发布-订阅消息系统,能够支撑海量数据的数据传递。Kafka通常用于运行监控数据。

58.用户可以在极短的时间内搜索到网站新发布的信息,这说明了大数据的(C)。
A:Variety 丰富性
B:Volume 容量
C:Velocity 高速性
D:Veracity 准确性

解析:“用户可以在很短时间内搜索到”体现了高速性特征。

59.大数据有哪些特点?(ABC)
A:体量大
B:来源多样
C:生成极快
D:变化周期慢

解析:大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

60.云计算和大数据有哪些区别?(B)
A:大数据是一种互联网的虚拟资源存贮,云计算总的来说是一种信息资产
B:云计算的价值则是能帮助企业等压缩其成本,起到节约效果。在庞大的数据中挖掘其中有效、有价值的信息这就是大数据的价值
C:大数据的出现在于用户服务需求的增长,及企业处理业务能力的提高,云计算的出现在于用户和社会各行各业所产生大的数据呈现几何倍数的增长
D:大数据处理的对象是互联网资源和应用,云计算处理的对象是数据

解析:大数据和云计算的区别:
1、首先云计算面对的是互联网资源和应用等,而大数据面对的是数据。
2、云计算则是一种互联网的虚拟资源存贮,而大数据总的来说是一种信息资产。
3、云计算的出现在于用户服务需求的增长,及企业处理业务能力的提高,大数据的出现在于用户和社会各行各业所产生大的数据呈现几何倍数的增长。
4、云计算注重资源分配,可以大量节约成本,是硬件资源的虚拟化,而大数据在于发掘数据的有效信息,海量数据的高效处理。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
8天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
10天前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
2月前
|
人工智能 分布式计算 DataWorks
连续四年!阿里云领跑中国公有云大数据平台
近日,国际数据公司(IDC)发布《中国大数据平台市场份额,2023:数智融合时代的真正到来》报告——2023年中国大数据平台公有云服务市场规模达72.2亿元人民币,其中阿里巴巴市场份额保持领先,占比达40.2%,连续四年排名第一。
191 12
|
2月前
|
人工智能 Cloud Native 数据管理
重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
阿里云发布首个AI多模数据管理平台DMS,助力业务决策提效10倍
299 17
|
2月前
|
SQL 人工智能 大数据
阿里云牵头起草!首个大数据批流融合国家标准发布
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
83 7
|
2月前
|
SQL 人工智能 大数据
首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准 GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
|
2月前
|
存储 SQL 分布式计算
Java连接阿里云MaxCompute例
要使用Java连接阿里云MaxCompute数据库,首先需在项目中添加MaxCompute JDBC驱动依赖,推荐通过Maven管理。避免在代码中直接写入AccessKey,应使用环境变量或配置文件安全存储。示例代码展示了如何注册驱动、建立连接及执行SQL查询。建议使用RAM用户提升安全性,并根据需要配置时区和公网访问权限。具体步骤和注意事项请参考阿里云官方文档。
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
10天前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
47 1
|
5天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
14 3
下一篇
无影云桌面