Ubuntu14.04下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,高可用系列 2核4GB
简介:

写在前面的话

  (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责、认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentOS6.5版本)和cloudermanager(基于CentOS6.5或Ubuntu14.04版本)。

  (2)  大数据集群范围包括3节点和4节点。本人都尝试过。

  (3)  安装搭建包括离线和在线。本人都尝试过

  (4)  版本包括自定义指定和官方最新版本搭建。本人都尝试过。

  (5) 大数据集群节点的增加和删减。本人都尝试过。

  (6) 虚拟机和真实物理机上搭建。本人都尝试过。

 

关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得(图文详解)

 

 

  我的机器情况是

  nssa-sensor1 (192.168.30.1)      (既做ambari-server,也做ambari-agent)

  nssa-sensor2 (192.168.30.2)      (只做ambari-agent)

  nssa-sensor3 (192.168.30.3)      (只做ambari-agent)

  nssa-sensor4 (192.168.30.4)      (只做ambari-agent)

 

 

 

 

 

 

 

  我这里是,参考

CentOS6.5下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)

 

 

 

 

 

第一步: 关于Ubuntu14.04下安装Ambari的准备

  这里,与CentOS6.5下相同,我这里不多说

Ambari安装之Ambari安装前准备(CentOS6.5)(一)

   大家,自行去安装,凡是能来看我这篇博客的朋友,想必肯定是有一定的基础了。

 

 

 

第二步:关于ubuntu14.04下部署本地库,镜像服务器

   这里,大家可以参考如下。

Ambari安装之部署本地库(镜像服务器)(二)

   我这里,考虑到ubuntu14.04,所以
 

   进行,下载好

 
 
  得到

 

 

 

 

   得到

 

 

 

 

 

 

  参考官网

https://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.0/bk_Installing_HDP_AMB/content/_getting_started_setting_up_a_local_repository.html

 

 

 

 

 

   以及,这第二步里,要注意的是,

  centos系统里,是

sudo yum install yum-utils createrepo 

  

   ubuntu系统里,是

sudo apt-get  install yum-utils createrepo 

 

  

   centos系统里,是

sudo yum install httpd

 

  ubuntu系统里,是

sudo apt-get install httpd

 

  

  然后,
部署,跟上述博客一样,放在/var/www/html下。我这里不多赘述。

      或者放在//usr/local/apache/htdocs下,都是可以的。

  参考我下面的博客,

Ubuntu14.04下编译安装或apt-get方式安装搭建Apache或Httpd服务(图文详解)

 

  总结:就是,这里我们自定义构建局域网源,一种是放在/var/www/html下,一种是放在/usr/local/apache/htdocs下。都是可以的

  最后,我将截图如下

 

 

 

   /usr/loca/apache/htdocs

 

 

 

   /var/www/html

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  然后,大家,可以将官方的,改成自己本地局域创建的本地源。用来安装ambari。

sudo wget http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0/ambari.list

  

  这是官网的。里面的内容如下

#VERSION_NUMBER=2.2.1.0-161
deb http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0 Ambari main

 

 

  我们要改成自己的。

#VERSION_NUMBER=2.2.1.0-161
deb http://192.168.30.1/hdp2.4/ubuntu14

   或者

#VERSION_NUMBER=2.2.1.0-161
deb http://192.168.30.1/hdp2.4/ubuntu14  Ambari main
 

 

  贴图如下

 

 

 

 

 

 

 

 

 

   即,是如下。说明自定义局域网搭建的本地源,成功!

 

 

 

 

 

   这里是,官网

 

 

   我这里,是采取离线方式的安装,即先下载好,再来安装。

   若大家,想在线安装的话,自行结合官网,然后和这篇博客来吧

       ubuntu14.04安装ambari

  在ubuntu14.04上使用ambari搭建hadoop集群

 

 

 

 

  

 

 

 

 

 

第三步:Ubuntu14.04下,安装并配置Ambaro-server

   这里,可以参考

Ambari安装之安装并配置Ambari-server(三)

 

 

  注意这里,用到的源还是官网的

 

  sudo vim /etc/apt/sources.list.d

 

#VERSION_NUMBER=2.2.1.0-161
deb http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0 Ambari main

 

 

 

 

 

sudo   apt-get install ambari-server

 

  正在安装中....

 

   至此,ambari-server安装完成!

   

   

   接下来,就是对ambari-server进行设置

 

 

 

  

  这是我的jdk安装路径

 

 

 

 

 

 

 

   这里为什么要回车,因为提示必须安装MySQL JDBC,回车结束ambari配置。

  怎么来解决呢?需要将Ambari数据库脚本导入到数据库。

  用Ambari用户(上面设置的用户)登录mysql

 

   我是这么先设置好的

复制代码
mysql> create database ambari DEFAULT CHARACTER SET utf8;
Ignoring query to other database
mysql> grant all on ambari.* TO 'hive'@'localhost' IDENTIFIED BY 'ambari_password';
Ignoring query to other database
mysql> grant all on *.* TO 'ambari'@'nssa-sensor1' IDENTIFIED BY 'ambari_password';
Ignoring query to other database
mysql> grant all on ambari.* TO 'ambari'@'%' IDENTIFIED BY 'ambari_password';  
Ignoring query to other database

mysql> flush privileges;
mysql> exit;
复制代码

 

 

  或者

复制代码
mysql> create database ambari DEFAULT CHARACTER SET utf8;
Ignoring query to other database

Ignoring query to other database
mysql> grant all on *.* TO 'ambari'@'nssa-sensor1' IDENTIFIED BY 'ambari_password';


mysql> flush privileges;
mysql> exit;
复制代码

  

 

  然后,将Ambari数据库脚本导入到数据库

mysql -uambari -pambari_password -hnssa-sensor1
use ambari
source /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql

  注意:这里密码和主机名,要根据你自己的机器去做。

 

  至此,ambari-server的安装和设置都做完成了。

 

 

   接下来,就是启动ambari-server了。

sudo  service ambari-server   status


sudo  service ambari-server   start

 

 

 

 

 

 

 

 

 

 

 

 

 

第四步:  搭建单节点集群

  这里,可以参考

Ambari安装之部署单节点集群

   这里,单节点的安装,我就不多赘述了。因为,我这里是搭建的真实物理机器,4台。

 

 

 

 

第五步:  搭建3或4节点集群

  这里,可以参考

Ambari安装之部署3个节点的HA分布式集群

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   在这一步,安装过程中,大家也许会出现问题。

 

 

   大家,可以去看我的博客

Ambari安装之部署单节点集群

  里面有讲到如何去解决

 

  

  同时,我这里,还遇到一个问题。在安装的过程中,没有权限去读取/var/lib/ambari-agent的data目录,这个很好解决,去放开权限,等安装完成后,改回755就是了。

 

 

 

 

 

 

 

 

   我这里,是所有的组件,我都全部安装了。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   这里大家,要去对hive、oozie设置下

复制代码
mysql> create database hive DEFAULT CHARACTER SET utf8;

mysql> grant all on *.* TO 'hive'@'nssa-sensor1' IDENTIFIED BY 'hive_password';


mysql> flush privileges;
mysql> exit;
复制代码

 

 

复制代码
mysql> create database oozie DEFAULT CHARACTER SET utf8;

mysql> grant all on *.* TO 'oozie'@'nssa-sensor1' IDENTIFIED BY 'oozie_password';


mysql> flush privileges;
mysql> exit;
复制代码

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   其实啊,这些步骤,大家完全可以去看的这篇博客

Ambari安装之部署3个节点的HA分布式集群

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  这些都是浏览信息,大家看看就好

 

 

 

 

 

 

 

 

 

 

  

 

 

 

   在这一步分发过程中,非常重要。大家会根据自己的网速和安装,会出现一些问题。

 

 

   大家,可以去看这篇博客

安装ambari的时候遇到的ambari和hadoop问题集

 

ambari-server启动出现Caused by: java.lang.RuntimeException:java.lang.ClassNotFoundEception:com.mysql.jdbc.Driver问题解决办法(图文详解)

ambari-server启动出现ERROR main] DBAccessorImpl:106 - Error while creating database accessor java.lang.ClassNotFoundException:com.mysql.jdbc.Driver问题解决办法(图文详解)

 

 

 

 

 

 

   当然,我这里作为补充

 

   其实,这样的,如oozie client insatll 或者 hadoop client install 或者 zookeeper  client install安装失败的原因。

   归结为就是第一次安装时,网速不稳定,导致,大家在反复安装,造成了软连接死锁的问题。

  这个问题的解决,其实很简单。

 

  第一:大家可以去看这篇博客

安装ambari的时候遇到的ambari和hadoop问题集

  这是一种解决方案的思路。

 

 

  第二:也是我自己摸索出来的

  我这里,是nssa-sensor2这台机器,已经安装好了,而其他的nssa-sensor1、nssa-sensor3和nssa-sensor4机器出现了上述问题。

  这样,大家,就把这台已经正常安装好了的机器的对应目录(哪个组件出错了),拷贝过去就行了。

 

  具体见我下面的贴图。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   这是/etc/zookeeper/2.4.0.0-169/0目录结构

 

 

 

 

 

   这是/usr/hdp/2.4.0.0-169/zookeeper目录结构

 

 

 

 

 

 

 

   这是/usr/hdp/2.4.0.0-169/zookeeper目录结构

 

 

 

 

 

   这是/usr/hdp/current/oozie-client目录结构

 

 

 

 

 

   这是/usr/hdp/current/oozie-server的目录结构

 

  至此,上述问题得以解决。

 

 

 

 

   然后,大家还会出现,这个在oozie安装的过程中,会出现mysql-connect-java的jar包放置问题。

 

  这里,大家,可以去看我下面写的博客

Oozie安装时放置Mysql驱动包的总结(网上最全)

 

   同时,要注意,/usr/share/java目录结构,是如下(大家也可以使用我刚说的技巧,就是已经成功了的机器,将其ooize的目录结构和这个/usr/share/java拷贝过来就可以了)(别说自己没U盘,我这里是在真实物理机器上搭建的,我都可以拷贝做到,或者你也可以使用scp -r命令)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/7134327.html,如需转载请自行联系原作者


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
SQL 分布式计算 大数据
请问本地安装了大数据计算MaxCompute studio,如何验证联通性及基本DDL操作呢?
请问本地安装了大数据计算MaxCompute studio,如何验证联通性及基本DDL操作呢?
67 0
|
2月前
|
消息中间件 监控 Ubuntu
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
96 3
大数据-54 Kafka 安装配置 环境变量配置 启动服务 Ubuntu配置 ZooKeeper
|
2月前
|
缓存 NoSQL Ubuntu
大数据-39 Redis 高并发分布式缓存 Ubuntu源码编译安装 云服务器 启动并测试 redis-server redis-cli
大数据-39 Redis 高并发分布式缓存 Ubuntu源码编译安装 云服务器 启动并测试 redis-server redis-cli
65 3
|
7月前
|
大数据 Docker 容器
大数据 安装指南-----利用docker
大数据 安装指南-----利用docker
101 0
|
6月前
|
分布式计算 Hadoop 大数据
【大数据】Hadoop下载安装及伪分布式集群搭建教程
【大数据】Hadoop下载安装及伪分布式集群搭建教程
278 0
|
7月前
|
分布式计算 Hadoop 大数据
[大数据] mac 史上最简单 hadoop 安装过程
[大数据] mac 史上最简单 hadoop 安装过程
|
7月前
|
大数据 Linux 虚拟化
大数据软件基础(3) —— 在VMware上安装Linux集群
大数据软件基础(3) —— 在VMware上安装Linux集群
120 0
|
7月前
|
分布式计算 大数据 Hadoop
Python大数据之PySpark(二)PySpark安装
Python大数据之PySpark(二)PySpark安装
582 0
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
342 7
|
1月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
51 2