Ubuntu14.04下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介:

写在前面的话

  (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责、认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentOS6.5版本)和cloudermanager(基于CentOS6.5或Ubuntu14.04版本)。

  (2)  大数据集群范围包括3节点和4节点。本人都尝试过。

  (3)  安装搭建包括离线和在线。本人都尝试过

  (4)  版本包括自定义指定和官方最新版本搭建。本人都尝试过。

  (5) 大数据集群节点的增加和删减。本人都尝试过。

  (6) 虚拟机和真实物理机上搭建。本人都尝试过。

 

关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得(图文详解)

 

 

  我的机器情况是

  nssa-sensor1 (192.168.30.1)      (既做ambari-server,也做ambari-agent)

  nssa-sensor2 (192.168.30.2)      (只做ambari-agent)

  nssa-sensor3 (192.168.30.3)      (只做ambari-agent)

  nssa-sensor4 (192.168.30.4)      (只做ambari-agent)

 

 

 

 

 

 

 

  我这里是,参考

CentOS6.5下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)

 

 

 

 

 

第一步: 关于Ubuntu14.04下安装Ambari的准备

  这里,与CentOS6.5下相同,我这里不多说

Ambari安装之Ambari安装前准备(CentOS6.5)(一)

   大家,自行去安装,凡是能来看我这篇博客的朋友,想必肯定是有一定的基础了。

 

 

 

第二步:关于ubuntu14.04下部署本地库,镜像服务器

   这里,大家可以参考如下。

Ambari安装之部署本地库(镜像服务器)(二)

   我这里,考虑到ubuntu14.04,所以
 

   进行,下载好

 
 
  得到

 

 

 

 

   得到

 

 

 

 

 

 

  参考官网

https://docs.hortonworks.com/HDPDocuments/Ambari-2.2.1.0/bk_Installing_HDP_AMB/content/_getting_started_setting_up_a_local_repository.html

 

 

 

 

 

   以及,这第二步里,要注意的是,

  centos系统里,是

sudo yum install yum-utils createrepo 

  

   ubuntu系统里,是

sudo apt-get  install yum-utils createrepo 

 

  

   centos系统里,是

sudo yum install httpd

 

  ubuntu系统里,是

sudo apt-get install httpd

 

  

  然后,
部署,跟上述博客一样,放在/var/www/html下。我这里不多赘述。

      或者放在//usr/local/apache/htdocs下,都是可以的。

  参考我下面的博客,

Ubuntu14.04下编译安装或apt-get方式安装搭建Apache或Httpd服务(图文详解)

 

  总结:就是,这里我们自定义构建局域网源,一种是放在/var/www/html下,一种是放在/usr/local/apache/htdocs下。都是可以的

  最后,我将截图如下

 

 

 

   /usr/loca/apache/htdocs

 

 

 

   /var/www/html

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  然后,大家,可以将官方的,改成自己本地局域创建的本地源。用来安装ambari。

sudo wget http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0/ambari.list

  

  这是官网的。里面的内容如下

#VERSION_NUMBER=2.2.1.0-161
deb http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0 Ambari main

 

 

  我们要改成自己的。

#VERSION_NUMBER=2.2.1.0-161
deb http://192.168.30.1/hdp2.4/ubuntu14

   或者

#VERSION_NUMBER=2.2.1.0-161
deb http://192.168.30.1/hdp2.4/ubuntu14  Ambari main
 

 

  贴图如下

 

 

 

 

 

 

 

 

 

   即,是如下。说明自定义局域网搭建的本地源,成功!

 

 

 

 

 

   这里是,官网

 

 

   我这里,是采取离线方式的安装,即先下载好,再来安装。

   若大家,想在线安装的话,自行结合官网,然后和这篇博客来吧

       ubuntu14.04安装ambari

  在ubuntu14.04上使用ambari搭建hadoop集群

 

 

 

 

  

 

 

 

 

 

第三步:Ubuntu14.04下,安装并配置Ambaro-server

   这里,可以参考

Ambari安装之安装并配置Ambari-server(三)

 

 

  注意这里,用到的源还是官网的

 

  sudo vim /etc/apt/sources.list.d

 

#VERSION_NUMBER=2.2.1.0-161
deb http://public-repo-1.hortonworks.com/ambari/ubuntu14/2.x/updates/2.2.1.0 Ambari main

 

 

 

 

 

sudo   apt-get install ambari-server

 

  正在安装中....

 

   至此,ambari-server安装完成!

   

   

   接下来,就是对ambari-server进行设置

 

 

 

  

  这是我的jdk安装路径

 

 

 

 

 

 

 

   这里为什么要回车,因为提示必须安装MySQL JDBC,回车结束ambari配置。

  怎么来解决呢?需要将Ambari数据库脚本导入到数据库。

  用Ambari用户(上面设置的用户)登录mysql

 

   我是这么先设置好的

复制代码
mysql> create database ambari DEFAULT CHARACTER SET utf8;
Ignoring query to other database
mysql> grant all on ambari.* TO 'hive'@'localhost' IDENTIFIED BY 'ambari_password';
Ignoring query to other database
mysql> grant all on *.* TO 'ambari'@'nssa-sensor1' IDENTIFIED BY 'ambari_password';
Ignoring query to other database
mysql> grant all on ambari.* TO 'ambari'@'%' IDENTIFIED BY 'ambari_password';  
Ignoring query to other database

mysql> flush privileges;
mysql> exit;
复制代码

 

 

  或者

复制代码
mysql> create database ambari DEFAULT CHARACTER SET utf8;
Ignoring query to other database

Ignoring query to other database
mysql> grant all on *.* TO 'ambari'@'nssa-sensor1' IDENTIFIED BY 'ambari_password';


mysql> flush privileges;
mysql> exit;
复制代码

  

 

  然后,将Ambari数据库脚本导入到数据库

mysql -uambari -pambari_password -hnssa-sensor1
use ambari
source /var/lib/ambari-server/resources/Ambari-DDL-MySQL-CREATE.sql

  注意:这里密码和主机名,要根据你自己的机器去做。

 

  至此,ambari-server的安装和设置都做完成了。

 

 

   接下来,就是启动ambari-server了。

sudo  service ambari-server   status


sudo  service ambari-server   start

 

 

 

 

 

 

 

 

 

 

 

 

 

第四步:  搭建单节点集群

  这里,可以参考

Ambari安装之部署单节点集群

   这里,单节点的安装,我就不多赘述了。因为,我这里是搭建的真实物理机器,4台。

 

 

 

 

第五步:  搭建3或4节点集群

  这里,可以参考

Ambari安装之部署3个节点的HA分布式集群

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   在这一步,安装过程中,大家也许会出现问题。

 

 

   大家,可以去看我的博客

Ambari安装之部署单节点集群

  里面有讲到如何去解决

 

  

  同时,我这里,还遇到一个问题。在安装的过程中,没有权限去读取/var/lib/ambari-agent的data目录,这个很好解决,去放开权限,等安装完成后,改回755就是了。

 

 

 

 

 

 

 

 

   我这里,是所有的组件,我都全部安装了。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   这里大家,要去对hive、oozie设置下

复制代码
mysql> create database hive DEFAULT CHARACTER SET utf8;

mysql> grant all on *.* TO 'hive'@'nssa-sensor1' IDENTIFIED BY 'hive_password';


mysql> flush privileges;
mysql> exit;
复制代码

 

 

复制代码
mysql> create database oozie DEFAULT CHARACTER SET utf8;

mysql> grant all on *.* TO 'oozie'@'nssa-sensor1' IDENTIFIED BY 'oozie_password';


mysql> flush privileges;
mysql> exit;
复制代码

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   其实啊,这些步骤,大家完全可以去看的这篇博客

Ambari安装之部署3个节点的HA分布式集群

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  这些都是浏览信息,大家看看就好

 

 

 

 

 

 

 

 

 

 

  

 

 

 

   在这一步分发过程中,非常重要。大家会根据自己的网速和安装,会出现一些问题。

 

 

   大家,可以去看这篇博客

安装ambari的时候遇到的ambari和hadoop问题集

 

ambari-server启动出现Caused by: java.lang.RuntimeException:java.lang.ClassNotFoundEception:com.mysql.jdbc.Driver问题解决办法(图文详解)

ambari-server启动出现ERROR main] DBAccessorImpl:106 - Error while creating database accessor java.lang.ClassNotFoundException:com.mysql.jdbc.Driver问题解决办法(图文详解)

 

 

 

 

 

 

   当然,我这里作为补充

 

   其实,这样的,如oozie client insatll 或者 hadoop client install 或者 zookeeper  client install安装失败的原因。

   归结为就是第一次安装时,网速不稳定,导致,大家在反复安装,造成了软连接死锁的问题。

  这个问题的解决,其实很简单。

 

  第一:大家可以去看这篇博客

安装ambari的时候遇到的ambari和hadoop问题集

  这是一种解决方案的思路。

 

 

  第二:也是我自己摸索出来的

  我这里,是nssa-sensor2这台机器,已经安装好了,而其他的nssa-sensor1、nssa-sensor3和nssa-sensor4机器出现了上述问题。

  这样,大家,就把这台已经正常安装好了的机器的对应目录(哪个组件出错了),拷贝过去就行了。

 

  具体见我下面的贴图。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

   这是/etc/zookeeper/2.4.0.0-169/0目录结构

 

 

 

 

 

   这是/usr/hdp/2.4.0.0-169/zookeeper目录结构

 

 

 

 

 

 

 

   这是/usr/hdp/2.4.0.0-169/zookeeper目录结构

 

 

 

 

 

   这是/usr/hdp/current/oozie-client目录结构

 

 

 

 

 

   这是/usr/hdp/current/oozie-server的目录结构

 

  至此,上述问题得以解决。

 

 

 

 

   然后,大家还会出现,这个在oozie安装的过程中,会出现mysql-connect-java的jar包放置问题。

 

  这里,大家,可以去看我下面写的博客

Oozie安装时放置Mysql驱动包的总结(网上最全)

 

   同时,要注意,/usr/share/java目录结构,是如下(大家也可以使用我刚说的技巧,就是已经成功了的机器,将其ooize的目录结构和这个/usr/share/java拷贝过来就可以了)(别说自己没U盘,我这里是在真实物理机器上搭建的,我都可以拷贝做到,或者你也可以使用scp -r命令)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/7134327.html,如需转载请自行联系原作者


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
17天前
|
Ubuntu Linux 测试技术
Linux系统之Ubuntu安装cockpit管理工具
【10月更文挑战第13天】Linux系统之Ubuntu安装cockpit管理工具
64 4
Linux系统之Ubuntu安装cockpit管理工具
|
22天前
|
Ubuntu 应用服务中间件 nginx
Ubuntu安装笔记(三):ffmpeg(3.2.16)源码编译opencv(3.4.0)
本文是关于Ubuntu系统中使用ffmpeg 3.2.16源码编译OpenCV 3.4.0的安装笔记,包括安装ffmpeg、编译OpenCV、卸载OpenCV以及常见报错处理。
97 2
Ubuntu安装笔记(三):ffmpeg(3.2.16)源码编译opencv(3.4.0)
|
22天前
|
Ubuntu Linux C语言
Ubuntu安装笔记(二):ubuntu18.04编译安装opencv 3.4.0 opencv_contrib3.4.0
本文介绍了在Ubuntu 18.04系统上编译安装OpenCV 3.4.0及其扩展包opencv_contrib 3.4.0的详细步骤,包括下载源码、安装依赖、配置CMake和编译安装,以及常见问题的解决方法。
53 1
Ubuntu安装笔记(二):ubuntu18.04编译安装opencv 3.4.0 opencv_contrib3.4.0
|
19天前
|
Kubernetes Ubuntu Docker
从0开始搞K8S:使用Ubuntu进行安装(环境安装)
通过上述步骤,你已经在Ubuntu上成功搭建了一个基本的Kubernetes单节点集群。这只是开始,Kubernetes的世界广阔且深邃,接下来你可以尝试部署应用、了解Kubernetes的高级概念如Services、Deployments、Ingress等,以及探索如何利用Helm等工具进行应用管理,逐步提升你的Kubernetes技能树。记住,实践是最好的老师,不断实验与学习,你将逐渐掌握这一强大的容器编排技术。
50 1
|
22天前
|
Ubuntu Linux
软件安装(五):Ubuntu 18.04安装Teamviewer 看一遍就会
这篇文章介绍了在Ubuntu 18.04系统上通过图形界面和命令行两种方法安装TeamViewer远程控制软件的步骤。
24 2
|
4天前
|
消息中间件 Ubuntu Java
Ubuntu系统上安装Apache Kafka
Ubuntu系统上安装Apache Kafka
|
11天前
|
Ubuntu Linux
Ubuntu 16.04下无法安装.deb的解决方法
希望以上策略能有效协助您克服在Ubuntu 16.04中安装.deb文件时遇到的挑战。
11 0
|
23天前
|
并行计算 Ubuntu Linux
Ubuntu学习笔记(五):18.04安装多版本CUDA
这篇博客文章介绍了在Ubuntu 18.04系统上如何安装和切换不同版本的CUDA,以及如何安装不同版本的cuDNN。
138 2
|
23天前
|
并行计算 PyTorch TensorFlow
Ubuntu安装笔记(一):安装显卡驱动、cuda/cudnn、Anaconda、Pytorch、Tensorflow、Opencv、Visdom、FFMPEG、卸载一些不必要的预装软件
这篇文章是关于如何在Ubuntu操作系统上安装显卡驱动、CUDA、CUDNN、Anaconda、PyTorch、TensorFlow、OpenCV、FFMPEG以及卸载不必要的预装软件的详细指南。
2056 3
|
24天前
|
Ubuntu 虚拟化
软件安装(二):VMware ubuntu20.04 安装步骤
这篇文章是关于如何在VMware Workstation 16 Player上安装Ubuntu 20.04桌面版的详细步骤指南。
133 2
软件安装(二):VMware ubuntu20.04 安装步骤