阿里云大数据ACA及ACP复习题(181~190)

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
实时计算 Flink 版,1000CU*H 3个月
简介: 本人备考阿里云大数据考试时自行收集准备的题库,纯手工整理的,能够覆盖到今年7月份,应该是目前最新的,发成文章希望大家能一起学习,不要花冤枉钱去买题库背了,也希望大家能够顺利通关ACA和ACP考试。

181.PAI-DSW是一款云端机器学习开发IDE,为用户提供交互式编程环境,且DSW提供非持久化的本地存储,那么如何( D )实现持久化存储DSW数据。
A:创建PAI-DSW实例
B:编写持久化本地存储脚本
C:选择File > Export Notebook As... > 目标格式
D:创建NAS或OSS类型数据集,并将数据集挂载到DSW指定的路径

解析:DSW提供非持久化的本地存储,如果需要持久化存储DSW数据,需要创建NAS或OSS类型数据集,并将数据集挂载到DSW指定的路径

182.下列关于阿里云Flink版框架的描述正确的是?( B )
A:阿里云Flink版框架主要处理离线数据,Apache Flink则主要处理实时数据
B:阿里云FIik版是实时计算的一个流式计算引擎
C:Flink可以处理离线数据与实时数据
D:Flink主要实现将企业数据库的业务数据导入到其它在线存储平台上

解析https://help.aliyun.com/document_detail/110778.html
阿里云实时计算Flink版是一套基于Apache Flink构建的⼀站式实时大数据分析平台,提供端到端亚秒级实时数据分析能力,并通过标准SQL降低业务开发门槛,助力企业向实时化、智能化大数据计算升级转型。

183.下列关于Apache Spark的MLlib组件的描述正确是?( D )
A:基于内存多语言执行的核心引擎
B:提供流计算组件
C:是一个用来处理结构化数据的Spark组件
D:Spark机器学习库

解析:Spark的MLlib提供了较丰富的机器学习库,包括分类、回归、协同过滤、聚合,同时提供了模型选择、自动调参和交叉验证等工具来提高生产力。MLlib主要支持非深度学习的算法模块
链接:https://help.aliyun.com/document_detail/441938.html

184.一些实时数据产生后会有很高价值,但是这些数据的价值会随时间流逝而减少,流计算系统的价值在于业务方可在更短的时间内挖掘实时数据中的价值,并将这种低延迟转化为竞争优势。下列选项中,关于流计算系统,描述正确的是?( ABC )
A:处理大数据的基本要求,如每秒处理几十万条实时数据
B:保证数据较低延迟采集,达到秒级别,甚至是毫秒级别
C:支持大数据的基本架构,能够平滑扩展
D:开发复杂部署比较麻烦

解析:对于一个流计算系统来说,它应达到如下需求: (1)高性能。处理大数据的基本要求,如每秒处理几十万条数据。 (2)海量式。支持TB级甚至是PB级的数据规模。 (3)实时性。必须保证一个较低的时延,达到秒级,甚至是毫秒级别。 (4)分布式。支持大数据的基本架构,必须能够平滑扩展。 (5)易用性。能够快速进行开发和部署。 (6)可靠性。能可靠地处理流数据。

185.HDFS主要采用主从结构模型,分别负责数据请求与数据存储的功能,其中主(master)节点进程名是?( B )
A:DataNode
B:NameNode
C:ResourceManager
D:NodeManager

解析:HDFS的主节点称为 NameNode

186.HDFS主要采用主从结构模型,分别负责数据请求与数据存储的功能,以下选项中关于这种结构描述正确的是?( AC )
A:HDFS采用了Master/Slave结构模型
B:一个HDFS集群包含一个DataNode和若干个NameNode
C:NameNode为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问
D:副本默认为1份,副本数可以通过配置文件修改

解析:HDFS采用了主从(Master/Slave)结构模型; 一个HDFS集群包括一个NameNode和若干个DataNode; Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问; 可以通过修改hdfs的配置文件自定义块大小,默认每个块的副本数是3,可以通过修改hdfs的配置文件自定义副本数;

187.MaxCompute支持流式数据实时写入并在数据仓库中开展分析。高性能秒级弹性并发查询,满足近实时分析场景需求。体现了MaxCompute在大数据处理与分析中的什么作用?( C )
A:弹性能力与扩展型
B:集成AI能力
C:支持流式采集和近实时分析
D:数据存储能力

解析https://help.aliyun.com/document_detail/27800.html 支持流式采集和近实时分析 支持流式数据实时写入并在数据仓库中开展分析。 与云上主要流式服务深度集成,轻松接入各种来源的流式数据。 支持高性能秒级弹性并发查询,满足近实时分析场景需求。

188.云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级解决方案。( A )
A:数据仓库
B:非关系型数据库
C:网络服务
D:数据库建模

解析:云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。
链接:https://help.aliyun.com/product/27797.html

189.Quick BI中,能无缝对接各类数据源,10亿+数据聚合亚秒级响应,体现了其哪种优势?( D )
A:智能数据分析和交互
B:快速搭建数据门户
C:安全管控数据权限
D:强大的Quick数据引擎

解析:链接:https://www.aliyun.com/product/bigdata/bi
强大的Quick数据引擎 内置查询加速引擎支持多种加速模式,亿级数据秒级处理

190.使用Flume采集系统日志数据时,Flume的正确流程是?( A )
A:Web数据源-Source一Channel一Sink一HDFS
B:Web数据源-Sink一Channel一Source-HDFS
C:Web数据源一Channel一Source一Sink一HDFS
D:Web数据源一Source一Sink一Channel一HDFS

解析:Flume架构是souce-channel-sink,可参考:https://flume.apache.org/

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
存储 分布式计算 大数据
【赵渝强老师】阿里云大数据存储计算服务:MaxCompute
阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。
240 0
|
4月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
496 0
|
2月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年8月
阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
301 1
|
2月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
283 1
|
存储 机器学习/深度学习 人工智能
阿里云ODPS:在AI浪潮之巅,铸就下一代智能数据根基
在智能爆炸时代,ODPS正从传统数据平台进化为“AI操作系统”。面对千亿参数模型与实时决策挑战,ODPS通过流批一体架构、多模态处理、智能资源调度等技术创新,大幅提升效率与智能化水平。从自动驾驶到医疗联合建模,从数字孪生到低代码AI开发,ODPS正重塑企业数据生产力,助力全球客户在算力洪流中抢占先机。
183 0
|
2月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
193 14
|
4月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
169 4
|
3月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
160 0