大数据开发之Hadoop 伪分布式安装（2）

2023-03-01 322

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 你好看官，里面请！今天笔者讲的是大数据开发之Hadoop 伪分布式安装（2）。不懂或者觉得我写的有问题可以在评论区留言，我看到会及时回复。注意：本文仅用于学习参考，不可用于商业用途，如需转载请跟我联系。

大数据开发之Hadoop 伪分布式安装（2）

Hadoop 的下载与安装

在介绍 Hadoop 的安装之前，先介绍一下 Hadoop 对各个节点的角色定义。

Hadoop 可以分别从三个角度将主机划分为两种角色。第一，最基本的划分为 Master 和 Slave，即主人与奴隶；第二，从 HDFS 的角度，将主机划分为 NameNode 和 DataNode(在分布式文件系统中，目录的管理很重要，管理目录相当于主人，而 NameNode 就是目录管理者)；第三，从 MapReduce 的角度，将主机划分为 JobTracker 和 TaskTracker(一个 Job 可以划分为多个Task)。

1、Hadoop的安装模式

Hadoop 有三种安装模式，分别为：单机模式、伪分布式和完全分布式(集群)。

其中，安装单机模式的 Hadoop 无须配置，在这种方式下，Hadoop 被认为是一个单独的 Java 进程，这种方式经常用来测试。

本篇博文主要介绍伪分布式的 Hadoop 安装，可以把伪分布式的 Hadoop 看作是只有一个节点的集群，在这个集群中，这个节点既是 Master，也是 Slave；既是 NameNode，也是 DataNode；既是 JobTracker，也是 TaskTracker。关于完全分布式的 Hadoop 下篇博文再进行介绍。

2、Hadoop 的下载

本篇博文中使用的 Hadoop 的安装版本为 Hadoop 3.2.0，下载 Hadoop 的网址为：https://hadoop.apache.org/releases.html，如下图所示：

单击后，进入一个新的页面，向下拉动浏览器的滚动条，找到我们需要的 hadoop 版本，如下图所示：

找到我们需要的 hadoop 版本之后，鼠标左键点击，进入到新的界面，然后选择 hadoop-3.2.0.tar.gz 进行下载，如下图所示：

注意：如果发现这个国外的地址下载比较慢，可以使用国内的镜像地址下载，但是这些国内的镜像地址中提供的安装包版本可能不全，如果没有找到我们需要的版本，那还是要老老实实到官网下载。

这些国内的镜像地址里面不仅仅有 Hadoop 的安装包，里面包含了大部分 Apache 组织中的软件安装包：

地址1：https://mirrors.tuna.tsinghua.edu.cn/apache/

将下载好的安装包 hadoop-3.2.0.tar.gz 复制到共享文件夹中，以便 Ubuntu 系统可以对此安装包进行下一步的操作。

3、Hadoop 的安装

Hadoop 的安装步骤如下：

解压缩 Hadoop 安装包。将安装包从共享文件夹复制到主目录下，打开终端，输入如下命令，将 Hadoop 安装包解压缩到当前目录下。命令：tar -zxvf hadoop-3.2.0.tar.gz

命令执行后，系统开始解压缩 hadoop-3.2.0.tar.gz 文件，屏幕上不断显示解压过程信息，如上图所示(由于篇幅问题，只显示部分解压信息)，当解压完成后，系统将在主目录下创建 hadoop-3.2.0 子目录，此为 Hadoop 的安装目录。

查看一下 Hadoop 安装目录中的安装文件，输入命令：

至此，Hadoop 安装完毕，但是要使用 Hadoop，还需要进行一系列的配置。下一小节见！

大数据开发之Hadoop 伪分布式安装（2）

大数据开发之Hadoop 伪分布式安装（2）

Hadoop 的下载与安装

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大数据开发之Hadoop 伪分布式安装（2）

大数据开发之Hadoop 伪分布式安装（2）

Hadoop 的下载与安装

热门文章

最新文章

相关课程

相关电子书