开发者学堂课程【2020版大数据实战项目之 DMP 广告系统(第二阶段): CDH 搭建_ Hadoop _安装包】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/677/detail/11770
CDH 搭建_ Hadoop _安装包
内容介绍:
一、安装 Hadoop 的步骤
二、安装 Hadoop 软件包
已经安装了第一个 cdh 的程序即 Zookeeper 。本节课安装一个非常重要的程序,叫 Hadoop 。
一、安装 Hadoop 的步骤
在安装 Hadoop 时要分为多个步骤安装:第一步,安装 Hadoop 软件包;第二步,配置 HDFS ;第三步,配置 Yarn 。启动 HDFS 、Yarn ,整个 Hadoop 就安装完成。安装过程比较复杂但是步骤并不多。进入笔记中,找到 Hadoop 部分。
首先要关心的就是集群规划,即安装一个软件之前要想清楚在哪一个节点上装什么样的服务。首先, cdh 01的职责是比较重的因为大家都是一个 cpu 核心,两个 g 内存的情况,所以 node 01的负载还是比较高的,就需要针对 node 01进行一些简配。比如在 node 01上只装一个 ResourceManager 不装 NodeManager ;只装一个 NameNode 不装 DataNode 。这时 node 01相应的负载就会减轻,之后会在 node 01上启动 SecondaryNamenode 进行相应的辅助,还要启动 MapReduce HistoryServer 到时侯直接通过 cdh 01查看历史任务。之后还会在 cdh 01上运行 Hadoop 的指令,比如 HDFS 、 Yarn 就需要安装 Clients 。接下来在 cdh 02中,可以直接安装 NodeManager 和 DataNode 。 cdh 03中也是一样的。所以,从机只装一个装 NodeManager 和 DataNode ,也有计划到时候把 cdh 02和03的内存减少为1 g 。
二、安装 Hadoop 软件包
接下来看第一步,安装 Hadoop 软件包。刚才已经讲过集群规划,所以针对于主节点和从节点安装的软件包是不一样的;在主节点中 需要安装 yum -y install hadoop hadoop-yarn-resourcemanager hadoop-yarn-nodemanager hadoop-hdfs-secondarynamenode hadoop-hdfs-namenode hadoop-hdfs-datanode hadoop-mapreduce hadoop-mapreduce-historyserver hadoop-client
包,但是在从节点中,只需要安装个别的 yum -y install hadoop hadoop-yarn-nodemanager hadoop-hdfs-datanode hadoop-mapreduce hadoop-client
包即可,上述内容就是本视频需要完成的内容。
首先,拷贝主节点上要安装的内容,进入窗口当中,进入 cdh 01中,直接将命令粘贴至此。可以看到安装了一个 hadoop 基本包、一个hadoop-yarn-resourcemanager 、一个 hadoop-yarn-nodemanager 。
这是不合理的,所以去掉 nodemanager ,装上不启动也是可以的。接着看 hadoop-hdfs-secondarynamenode hadoop-hdfs-namenode
都是需要的。因为 hadoop-hdfs-datanode 不需要,所以删除。如果已将安装是没影响的,只要不启动就可以。 hadoop-mapreduce hadoop-mapreduce-historyserver hadoop-client
都装在主节点中。按回车等待安装。
回到笔记当中查看 cdh 02和03当中需要安装的包。第一个 hadoop 基础包是必须装的,提供一些 Commonlib ,接下来hadoop-yarn-nodemanager hadoop-hdfs-datanode hadoop-mapreduce hadoop-client
都需要安装,复制上述指令,进入到 node 02( cdh 02)当中,粘贴至此;执行该指令。再次进入到 node 03( cdh 03)当中,粘贴至此,执行指令。虽然都是从本地下载,但是执行命令仍会消耗一些时间。