Centos下搭建Hadoop伪分布式（二）-阿里云开发者社区

Centos下搭建Hadoop伪分布式（二）

2023-01-01 474

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Centos下搭建Hadoop伪分布式

修改 Hadoop 的配置文件

Hadoop的配置文件位于安装目录的 /etc/hadoop 目录下，在本教程中即位于 /url/local/hadoop/etc/hadoop 目录下，需要修改的配置文件为如下两个:

cd /usr/local/hadoop/etc/hadoop

编辑 core-site.xml，修改节点的内容为如下所示：

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>location to store temporary files</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

:wq 保存退出

接下来，编辑 hdfs-site.xml，修改节点的内容为如下所示：

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

格式化 NameNode

格式化NameNode:

/usr/local/hadoop/bin/hdfs namenode -format

在输出信息中看到如下信息，则表示格式化成功:

Storage directory /usr/local/hadoop/tmp/dfs/name has been successfully formatted.
Exiting with status 0

启动 NameNode 和 DataNode 守护进程

启动 NameNode 和 DataNode 进程:

/usr/local/hadoop/sbin/start-dfs.sh

执行过程中会提示输入用户密码，输入 root 用户密码即可。另外，启动时ssh会显示警告提示是否继续连接，输入 yes 即可。

检查 NameNode 和 DataNode 是否正常启动:

jps

如果NameNode和DataNode已经正常启动，会显示NameNode、DataNode和SecondaryNameNode的进程信息:

[root@somnus-hadoop  ~]$ jps
3689 SecondaryNameNode
3520 DataNode
3800 Jps
3393 NameNode

运行 Hadoop 伪分布式实例

Hadoop自带了丰富的例子，包括 wordcount、grep、sort 等。下面我们将以grep例子为教程，输入一批文件，从中筛选出符合正则表达式 dfs[a-z.]+ 的单词并统计出现的次数。

查看 Hadoop 自带的例子

Hadoop 附带了丰富的例子, 执行下面命令可以查看：

cd /usr/local/hadoop
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar

在 HDFS 中创建用户目录

在 HDFS 中创建用户目录 hadoop：

/usr/local/hadoop/bin/hdfs dfs -mkdir -p /user/hadoop

我们将以 Hadoop 所有的 xml 配置文件作为输入数据。执行下面命令在 HDFS 中新建一个 input 文件夹并将 hadoop 配置文件上传到该文件夹下：

cd /usr/local/hadoop
./bin/hdfs dfs -mkdir /user/hadoop/input
./bin/hdfs dfs -put ./etc/hadoop/*.xml /user/hadoop/input

使用下面命令可以查看刚刚上传到 HDFS 的文件:

/usr/local/hadoop/bin/hdfs dfs -ls /user/hadoop/input

cd /usr/local/hadoop
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar grep /user/hadoop/input /user/hadoop/output 'dfs[a-z.]+'

上述命令以 HDFS 文件系统中的 input 为输入数据来运行 Hadoop 自带的 grep 程序，提取其中符合正则表达式 dfs[a-z.]+ 的数据并进行次数统计，将结果输出到 HDFS 文件系统的 output 文件夹下。

查看运行结果

上述完成后的结果保存在 HDFS 中，通过下面命令查看结果:

/usr/local/hadoop/bin/hdfs dfs -cat /user/hadoop/output/*

如果运行成功，可以看到如下结果:

1 dfsadmin
1 dfs.replication
1 dfs.namenode.name.dir
1 dfs.datanode.data.dir

删除 HDFS 上的输出结果

删除 HDFS 中的结果目录:

/usr/local/hadoop/bin/hdfs dfs -rm -r /user/hadoop/output

运行 Hadoop 程序时，为了防止覆盖结果，程序指定的输出目录不能存在，否则会提示错误，因此在下次运行前需要先删除输出目录。

关闭 Hadoop 进程

关闭 Hadoop 进程：

/usr/local/hadoop/sbin/stop-dfs.sh

再起启动只需要执行下面命令：

/usr/local/hadoop/sbin/start-dfs.sh

Centos下搭建Hadoop伪分布式（二）

修改 Hadoop 的配置文件

Hadoop的配置文件位于安装目录的 /etc/hadoop 目录下，在本教程中即位于 /url/local/hadoop/etc/hadoop 目录下，需要修改的配置文件为如下两个:

:wq 保存退出

接下来，编辑 hdfs-site.xml，修改节点的内容为如下所示：

格式化 NameNode

格式化NameNode:

在输出信息中看到如下信息，则表示格式化成功:

启动 NameNode 和 DataNode 守护进程

启动 NameNode 和 DataNode 进程:

运行 Hadoop 伪分布式实例

查看 Hadoop 自带的例子

Hadoop 附带了丰富的例子, 执行下面命令可以查看：

在 HDFS 中创建用户目录

在 HDFS 中创建用户目录 hadoop：

删除 HDFS 上的输出结果

删除 HDFS 中的结果目录:

关闭 Hadoop 进程

关闭 Hadoop 进程：

再起启动只需要执行下面命令：

至此，centos下搭建Hadoop分布式环境就结束了。

如果本文对你有所帮助，欢迎关注点赞，分享给您身边的朋友。您的鼓励就是对我的最大动力。

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Centos下搭建Hadoop伪分布式（二）

修改 Hadoop 的配置文件

Hadoop的配置文件位于安装目录的 /etc/hadoop 目录下，在本教程中即位于 /url/local/hadoop/etc/hadoop 目录下，需要修改的配置文件为如下两个:

:wq 保存退出

接下来，编辑 hdfs-site.xml，修改节点的内容为如下所示：

格式化 NameNode

格式化NameNode:

在输出信息中看到如下信息，则表示格式化成功:

启动 NameNode 和 DataNode 守护进程

启动 NameNode 和 DataNode 进程:

运行 Hadoop 伪分布式实例

查看 Hadoop 自带的例子

Hadoop 附带了丰富的例子, 执行下面命令可以查看：

在 HDFS 中创建用户目录

在 HDFS 中创建用户目录 hadoop：

删除 HDFS 上的输出结果

删除 HDFS 中的结果目录:

关闭 Hadoop 进程

关闭 Hadoop 进程：

再起启动只需要执行下面命令：

至此，centos下搭建Hadoop分布式环境就结束了。

如果本文对你有所帮助，欢迎关注点赞，分享给您身边的朋友。您的鼓励就是对我的最大动力。

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像