阿里云E-MapReduce 创建集群

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介:

进入创建集群页面

登录阿里云 E-MapReduce 控制台集群列表。

完成 RAM 授权,操作步骤请参见角色授权。

在上方选择所在的地域(Region),所创建集群将会在对应的地域内,一旦创建后不能修改。

单击右上方的创建集群按钮,进行创建。

创建集群流程

要创建集群,您需要继续完成以下 3 个步骤:

软件配置
硬件配置
基础配置

步骤1:软件配置

配置项说明:

产品版本:选择默认最新的软件版本

集群类型:目前的EMR提供了

Hadoop标准的 Hadoop 集群,包含了大部分的 Hadoop 相关的组件,具体的组件信息可以在选择界面的列表中查看。
Kafka独立的 Kafka 集群,提供消息服务。
包含配置:使用默认的配置,后期可以在管理界面中添加和启停服务。

安全模式:是否开启集群的 Kerberos 认证功能。一般的个人用户集群无需该功能,默认关闭它。

步骤2:硬件配置

配置项说明:

付费配置

付费类型测试的场景下使用按量开始,测试都正常了以后。可以新建一个包月的生产集群正式使用。
集群网络配置

集群可用区:一般使用默认的可用区即可。

网络类型:推荐使用VPC。若还未创建,可前往VPC控制台进行创建。

注意:经典网络与专有网络不互通,购买后不能更换网络类型。

ECS 实例系列:使用默认最新的系列。

VPC:选择在该地域的VPC。

交换机:选择在对应的VPC下的在对应可用区的交换机,如果在这个可用区没有可用的交换机,那么就需要前往去创建一个新的使用。

新建安全组:一般用户初次来到这里还没有安全组,打开“新建安全组”开关,在“安全组名称”里面填上新的安全组的名字。

选择安全组:若已经有在使用的安全组可以直接这里选择使用。

集群节点配置

高可用集群:后续正式集群如果是使用高可用的,测试情况下也打开高可用。

节点类型:只需要使用Master和Core,Task可以不用,需要的时候再追加。

节点配置: 使用默认配置

数据盘类型:根据需要选择高效或者是SSD云盘。

数据盘容量:根据需要调整磁盘容量,推荐至少80G

实例数量:根据需要调整

步骤3:基础配置

配置项说明:

基本信息

集群名称:集群的名字,长度限制为 1-64 个字符,仅可使用中文、字母、数字、“-”和“_”。
运行日志

运行日志:是否保存作业的日志,日志保存默认是打开的。开启后会需要您选择用来保存日志的 OSS 目录位置,会将您的作业的日志保存到该 OSS 存储目录上。当然,您要使用这个功能必须先开通 OSS,同时上传的文件会按照使用的量来计算用户的费用。强烈建议您打开 OSS 日志保存功能,这会对您的作业调试和错误排查有极大的帮助。

日志路径:保存日志的 OSS 路径。

统一Meta数据库:推荐先关闭。

权限设置 无需调整,使用默认即可。

登录设置

登录密码:设置 master 节点的登录密码。8 - 30 个字符,且必须同时包含大写字母、小写字母、数字和特殊字符!@#$%^&*
配置清单和集群费用

在配置清单上确认配置和对应的费用

确认创建

当所有的信息都有效填写以后,“创建”按钮会亮起,确认无误后单击创建将会创建集群。

注意:

若是按量付费集群,集群会立刻开始创建。页面会返回集群列表页,就能看到在列表中有一个“集群创建中”的集群。请耐心等待,集群创建会需要几分钟时间。完成之后集群的状态会切换为“集群空闲”。

若是包年包月集群,则会先生成订单,在支付完成订单以后集群才会开始创建。

创建失败

如果创建失败,在集群列表页上会显示“集群创建失败”,将鼠标移动到红色的感叹号上会看到失败原因,如下图所示。


screenshot

创建失败的集群可以不用处理,对应的计算资源并没有真正的创建出来。这个集群会在停留3天以后自动隐藏。

相关实践学习
数据湖构建DLF快速入门
本教程通过使⽤数据湖构建DLF产品对于淘宝用户行为样例数据的分析,介绍数据湖构建DLF产品的数据发现和数据探索功能。
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
3天前
|
SQL 分布式计算 关系型数据库
阿里云E-MapReduce Trino专属集群外连引擎及权限控制踩坑实践
本文以云厂商售后技术支持的角度,从客户的需求出发,对于阿里云EMR-Trino集群的选型,外连多引擎的场景、Ldap以及Kerberos鉴权等问题进行了简要的实践和记录,模拟客户已有的业务场景,满足客户需求的同时对过程中的问题点进行解决、记录和分析,包括但不限于Mysql、ODPS、Hive connector的配置,Hive、Delta及Hudi等不同表格式读取的兼容,aws s3、阿里云 oss协议访问异常的解决等。
|
3天前
|
Java Go Maven
阿里云云效问题之使用香港构建集群有审计要求如何解决
云效镜像是指存储在阿里云效服务中的容器镜像,它们可以用于持续集成和持续部署(CI/CD)流程中;本合集将介绍如何在云效平台上管理和使用镜像资源,以及常见的镜像问题和解决办法。
137 0
|
3天前
|
Kubernetes 容器
要获取ACK(阿里云容器服务)集群中的Deployment
要获取ACK(阿里云容器服务)集群中的Deployment【1月更文挑战第8天】【1月更文挑战第40篇】
68 4
|
3天前
|
消息中间件 Kubernetes Kafka
Terraform阿里云创建资源1分钟创建集群一键发布应用Terraform 创建 Kubernetes 集群
Terraform阿里云创建资源1分钟创建集群一键发布应用Terraform 创建 Kubernetes 集群
33 0
|
3天前
|
Kubernetes 容器
阿里云OpenAPI咋取到ack集群的Deployment呀?
阿里云OpenAPI咋取到ack集群的Deployment呀?【1月更文挑战第17天】【1月更文挑战第84篇】
23 2
|
3天前
|
弹性计算 运维 Cloud Native
阿里云云原生弹性方案,用弹性解决集群资源利用率难题
本文主要介绍了通过弹性,实现成本优化,解决集群资源利用率难题。
92538 8
|
3天前
|
边缘计算 监控 Kubernetes
阿里云ACK Edge集群
阿里云ACK Edge集群(Alibaba Cloud ACK Edge Cluster)是一种基于阿里云ACK(Alibaba Cloud Kubernetes)服务的边缘计算集群,能够将应用程序部署到离用户更近的边缘节点上,从而提高应用程序的性能和可靠性。
83 1
|
3天前
|
分布式计算 Java Hadoop
IDEA 打包MapReduce程序到集群运行的两种方式以及XShell和Xftp过期的解决
IDEA 打包MapReduce程序到集群运行的两种方式以及XShell和Xftp过期的解决
|
3天前
|
分布式计算 Hadoop Java
【集群模式】执行MapReduce程序-wordcount
【集群模式】执行MapReduce程序-wordcount
|
3天前
|
Kubernetes 容灾 网络协议
阿里云 ACK One 新特性:多集群网关,帮您快速构建同城容灾系统
阿里云 ACK One 新特性:多集群网关,帮您快速构建同城容灾系统
61929 2

热门文章

最新文章