471.小明利用三天时间对MaxCompute做了详细了解后,想尝试开通MaxCompute,那么下面哪项( D )不能支撑小明的需求。
A:创建了阿里云账号
B:开通MaxCompute选择了按量计费模式
C:删除了项目名称为defaultproject系统随机码的默认项目
D:小明创建了RAM用户
解析:以RAM用户身份开通MaxCompute,需要获取RAM用户账号并已授予AliyunBSSOrderAccess和AliyunDataWorksFullAccess权限
472.DataWorks的DataStudio(数据开发)模块提供了界面化、智能高效的大数据数据开发与测试体验,那么DataStudio模式采用( ABD )结构,按照业务种类将相关的不同类型的节点任务组织在一起。
A:项目
B:解决方案
C:数据处理
D:业务流程
解析:数据开发模式采用项目-解决方案-业务流程三级结构,按照业务种类将相关的不同类型的节点任务组织在一起。
473.阿里云DataV的基本操作流程包含下列哪些( BCDEF )选项。
A:开通并本地部署DataV
B:准备工作
C:创建可视化应用
D:添加并配置可视化组件
E:调整组件图层位置
F:预览并发布可视化应用
解析:阿里云DataV暂时不支持本地部署
474.关于机器学习常见的算法分类描述正确的是( ABD )。
A:常见的机器学习算法可分为有监督学习和无监督学习及增强学习
B:分类属于有监督学习
C:回归属于无监督学习
D:聚类和关联规则均属于无监督学习
解析:回归属于有监督学习算法
475.大数据应用中用到了哪些云计算技术?( AB )
A:海量数据存储技术
B:海量数据管理技术
C:分布式计算
D:数据清洗和数据挖掘
解析:大数据用到的海量数据存储技术、海量数据管理技术、MapReduce等并行处理技术都是云计算的关键技术
476.大数据时代传统数据架构或典型数据库软件工具在处理海量数据时存在哪些方面的问题?( ABCE )
A:海量数据收集
B:海量数据存储
C:海量数据管理
D:海量数据的分析
E:数据的共享访问
解析:大数据技术主要问题有: 第一,成本高。传统存储设备通用性较差,随着业务需求的增长,未来的设备投资加上后期的维护、升级扩容的成本将会非常高。 第二,性能低。单节点的I/O性能瓶颈无法逾越,容量和性能都不容易进行扩展,难以支撑海量数据的高并发、低延时的场景。 第三,安全隐患多。数据传输过程中存在泄露、篡改、被数据流攻击等风险隐患。 基于此数据在采集、存储、管理、共享中都存在突出问题
477.某商品在推荐给特定用户之前,需要对用户的基本信息如:年龄、性别、所在地区、购买行为(购买过的商品类别、店铺)、浏览时长、购买收藏等进行全方位的收集、分析、得出结论。最终展示给用户的是“用户想看的商品“;。这体现了数据采集的哪一特点?( B )
A:多维性
B:全面性
C:高效性
D:灵活性
解析:根据题目“进行全方位的收集、分析、得出结论“;,全方位等关键信息,体现了数据的全面性
478.阿里云图计算服务GraphCompute的特点有哪些?( ABC )
A:高性能
B:高可用
C:百万级TPS
D:高成本
E:半托管
解析:链接:https://help.aliyun.com/document_detail/134189.html
图计算服务Graph Compute特点 高性能 查询延时低、数据导入快(千亿数据查询延时2ms以内,数据载入最高达500w doc/s ) 低成本 通过提供倒排查询和向量计算的扩展能力,同需求场景下,引擎资源开销是采用其他方案的50% 高可用 离线系统支持多版本备份,提供分钟级数据恢复功能,具有更强的容灾和数据回滚能力 百万级TPS Graph Compute采用异步更新架构,单节点支持百万级别TPS更新,保证数据的高实效性 全托管 提供图形化展示的控制台,提升数据开发效率。数据链路全托管,业务运维0投入
479.在数据预处理中,常用的规范化处理方法包括( ABD )
A:最大最小(Min-Max)规范化
B:z-score标准化
C:曲面规范化
D:小数定标标准化
解析:常用方法有min-max规范化、Z-score规范化、按小数定标规范化等
480.在原材料日购进&日消耗数据的可视化展示中,需要核对数据的完整性,对缺失的日数据进行补充和分组统计;最后将统计数据保存到数据仓库中。上述的这些操作属于数据可视化设计的哪一个步骤?( A )
A:数据准备
B:主题确认
C:图表选择
D:数据可视化
解析:核对数据的完整性,对缺失的日数据进行补充和分组统计,属于数据可视化