通过ambari安装hadoop集群(二)

简介: 本文图文结合简介如何通过ambari安装hadoop集群。

开始安装,输入主机名字,然后选择私钥。

cadc31384dffc1e820919ee415b35ffb7460b3c5

668b08529258bcbf98fa694a9e8a187819b0030a

注意java_home那里需要改为/usr/jdk64/jdk1.6.0_31,然后点击确认,它会出一个警告提示,别管他就行。

0117a211fe54c1004efec4fba5d13764502c2bb5

等待安装完毕之后,就会出现成功的提示,下面出现黄字的,查看一下warning,除了有mysql账户的问题之外,别的都要处理掉,否则安装过程会出问题的。搞定了,要再检查一遍!

bcef39bd5919e6a595eff27c95c3f904f10ddbb5

关闭它,然后进入下一步。

d55540c9216c1c863b5fce70f39e6bca80302ae5

全选吧,都要,然后进入下一步,哈哈!

7f5a9012f1813be945cc9d0c512ee702ef8b2450

因为是小集群,所以我就随便弄了,实际上不能这么搞的,然后点下一步。

在HDFS这一页的高级设置里面,找到这个参数,我设置为2,也可以设置成1,但是不能大于前面设置的datanode的数量,比如我只有两个datanode,我就不能设置为2分,否则会出错的。

7892632c1ef99c647c31c0b3dc36cd5bd63403e5

把这个安全认证也禁用了,否则用api访问的时候会说没权限的。

746746818ea65d2262c4c98aaf8521ccfeb0fc58

在HIVE页签

fa06622a2f4bed8f02d6d61fd1c08d8df1fcb133

点击下一步,下一步,进入安装过程的等待界面,如下:

519d7d37b114e57d26e49c85c135f1f9488f1f74

成功安装的界面,之后在主界面查看如下,全是绿的,行情一片大好啊!

1996b83ed59364be8865f436f4f5f84cfa1279a2

注意:ambari-server和ambari-agent不会开机启动,ambari-server是通过ambari-agent来控制每一台机器的,每次重启都需要手动开启。

没关系,很简单!在每一台机器上执行一下这句命令就可以啦!

chkconfig --add ambari-agent
目录
相关文章
|
7天前
|
分布式计算 负载均衡 Hadoop
Hadoop集群节点添加
Hadoop集群节点添加
|
11天前
|
分布式计算 资源调度 Hadoop
Hadoop【基础知识 03+04】【Hadoop集群资源管理器yarn】(图片来源于网络)(hadoop fs + hadoop dfs + hdfs dfs 使用举例)
【4月更文挑战第5天】Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)Hadoop【基础知识 04】【HDFS常用shell命令】(hadoop fs + hadoop dfs + hdfs dfs 使用举例)
39 9
|
12天前
|
分布式计算 资源调度 Hadoop
Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)
【4月更文挑战第4天】Hadoop【基础知识 03】【Hadoop集群资源管理器yarn】(图片来源于网络)
22 4
|
15天前
|
存储 分布式计算 Hadoop
【Hadoop】Hadoop的三种集群模式
【4月更文挑战第9天】【Hadoop】Hadoop的三种集群模式
|
16天前
|
分布式计算 Hadoop Java
centos 部署Hadoop-3.0-高性能集群(一)安装
centos 部署Hadoop-3.0-高性能集群(一)安装
16 0
|
分布式计算 Ubuntu Hadoop
Hadoop 的安装和使用(基于Linux~Ubuntu的虚拟机)
Hadoop 的安装和使用(基于Linux~Ubuntu的虚拟机)
908 0
Hadoop 的安装和使用(基于Linux~Ubuntu的虚拟机)
|
13天前
|
存储 分布式计算 Hadoop
大数据处理架构Hadoop
【4月更文挑战第10天】Hadoop是开源的分布式计算框架,核心包括MapReduce和HDFS,用于海量数据的存储和计算。具备高可靠性、高扩展性、高效率和低成本优势,但存在低延迟访问、小文件存储和多用户写入等问题。运行模式有单机、伪分布式和分布式。NameNode管理文件系统,DataNode存储数据并处理请求。Hadoop为大数据处理提供高效可靠的解决方案。
36 2
|
13天前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
15天前
|
SQL 分布式计算 Hadoop
利用Hive与Hadoop构建大数据仓库:从零到一
【4月更文挑战第7天】本文介绍了如何使用Apache Hive与Hadoop构建大数据仓库。Hadoop的HDFS和YARN提供分布式存储和资源管理,而Hive作为基于Hadoop的数据仓库系统,通过HiveQL简化大数据查询。构建过程包括设置Hadoop集群、安装配置Hive、数据导入与管理、查询分析以及ETL与调度。大数据仓库的应用场景包括海量数据存储、离线分析、数据服务化和数据湖构建,为企业决策和创新提供支持。
55 1
|
1月前
|
消息中间件 SQL 分布式计算
大数据Hadoop生态圈体系视频课程
熟悉大数据概念,明确大数据职位都有哪些;熟悉Hadoop生态系统都有哪些组件;学习Hadoop生态环境架构,了解分布式集群优势;动手操作Hbase的例子,成功部署伪分布式集群;动手Hadoop安装和配置部署;动手实操Hive例子实现;动手实现GPS项目的操作;动手实现Kafka消息队列例子等
20 1
大数据Hadoop生态圈体系视频课程