Hadoop单机模式部署

简介:

一、Hadoop部署模式

单机模式:默认情况下运行为一个单独机器上的独立Java进程,主要用于调试环境

伪分布模式:在单个机器上模拟成分布式多节点环境,每一个Hadoop守护进程都作为一个独立的Java进程运行

完全分布式模式:真实的生产环境,搭建在完全分布式的集群环境


二、添加用户和组

1
2
sudo  adduser hadoop                          ##创建用户hadoop
sudo  usermod  -G  sudo  hadoop                    ##将hadoop用户添加进sudo用户组


三、安装相关软件

1
2
3
4
sudo  apt-get update
sudo  apt-get -y  install  openssh-server  rsync  openjdk-7-jdk
sudo  service  ssh  restart
$ java -version

wKiom1ZqdkLT79muAAAYyRv7iTA099.png


四、配置SSH免密登录

1
2
3
4
su  -l hadoop                              ##切换至hadoop用户
ssh -keygen -t rsa -P  ""                    ##配置SSH免密登录
cat  ~/. ssh /id_rsa .pub >> ~/. ssh /authorized_keys     ##将公钥追加到authorized_keys中
ssh  localhost                            ##验证


五、Hadoop配置


①下载安装Hadoop

1
2
3
4
su  -l hadoop
$ wget http: //apache .fayea.com /hadoop/common/hadoop-2 .7.1 /hadoop-2 .7.1. tar .gz 
tar  -zxvf hadoop-2.7.1. tar .gz
sudo  mv  hadoop-2.7.1  /usr/local/hadoop

wKiom1ZqfYHjL61cAAATfLrD9O4929.png


②配置Hadoop

a.添加环境变量

1
2
3
4
5
6
7
8
9
10
11
12
13
14
vi  /home/hadoop/ .bashrc
#HADOOP START
export  JAVA_HOME= /usr/lib/jvm/java-7-openjdk-amd64
export  HADOOP_INSTALL= /usr/local/hadoop/
export  PATH=$PATH:$HADOOP_INSTALL /bin
export  PATH=$PATH:$HADOOP_INSTALL /sbin
export  HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export  HADOOP_COMMON_HOME=$HADOOP_INSTALL
export  HADOOP_HDFS_HOME=$HADOOP_INSTALL
export  YARN_HOME=$HADOOP_INSTALL
export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL /lib/native
export  HADOOP_OPTS= "-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP END
$ .   /home/hadoop/ .bashrc     ##重载使其生效

wKiom1ZqfQSQy-7EAAA_xMvga78946.png


六、测试

①创建输入数据

1
2
3
4
su  -l hadoop
cd  /usr/local/hadoop
sudo  mkdir  input
sudo  cp  /etc/passwd  input/


②执行Hadoop WordCount应用(词频统计)

1
$ bin /hadoop  jar share /hadoop/mapreduce/sources/hadoop-mapreduce-examples-2 .7.1-sources.jar org.apache.hadoop.examples.WordCount input output

wKiom1ZqhXmw05xGAABwmLjxay4549.png


③查看生成的单词统计数据

1
2
3
4
$ hadoop dfs - ls  output
-rw-r--r--   1 hadoop hadoop          0 2015-12-18 13:18 output /_SUCCESS
-rw-r--r--   1 hadoop hadoop       2128 2015-12-18 13:18 output /part-r-00000
$ hadoop dfs - cat  output/*


:

配置单节点Hadoop的文档:http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html#Standalone_Operation



本文转自  结束的伤感  51CTO博客,原文链接:http://blog.51cto.com/wangzhijian/1765696


相关文章
|
3月前
|
分布式计算 Hadoop Java
Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)
Hadoop快速入门——第一章、认识Hadoop与创建伪分布式模式(Hadoop3.1.3版本配置)
77 0
|
1月前
|
分布式计算 Hadoop 测试技术
Hadoop【环境搭建 05】【hadoop-3.1.3 单机版基准测试 TestDFSIO + mrbench + nnbench + Terasort + sort 举例】
【4月更文挑战第1天】Hadoop【环境搭建 05】【hadoop-3.1.3 单机版基准测试 TestDFSIO + mrbench + nnbench + Terasort + sort 举例】
37 3
|
1月前
|
分布式计算 资源调度 Hadoop
Hadoop【问题记录 02】【hadoop-3.1.3 单机版】ResourceManager无法启动NodeManager启动后过自动关闭 javax/activation/DataSource
【4月更文挑战第2天】Hadoop【问题记录 02】【hadoop-3.1.3 单机版】ResourceManager无法启动NodeManager启动后过自动关闭 javax/activation/DataSource
41 2
|
17天前
|
SQL 存储 分布式计算
基于Hadoop数据仓库Hive1.2部署及使用
基于Hadoop数据仓库Hive1.2部署及使用
|
17天前
|
存储 分布式计算 Hadoop
基于Hadoop分布式数据库HBase1.0部署及使用
基于Hadoop分布式数据库HBase1.0部署及使用
|
25天前
|
存储 分布式计算 Hadoop
Hadoop的运行模式
【4月更文挑战第12天】Hadoop支持三种运行模式:本地模式适用于初学者和小型项目;伪分布式集群模式用于测试,数据存储在HDFS;完全分布式集群模式,适用于企业级大规模数据处理,具有高吞吐量和容错性。选择模式取决于实际需求和环境配置。Hadoop的分布式计算特性使其在扩展性、容错性和可恢复性方面表现出色,是大数据处理的关键工具。
23 1
|
1月前
|
分布式计算 Hadoop
Hadoop【问题记录 01】【hadoop-3.1.3 单机版】【Attempting to operate on hdfs namenode as root】
【4月更文挑战第2天】Hadoop【问题记录 01】【hadoop-3.1.3 单机版】【Attempting to operate on hdfs namenode as root】
15 0
|
1月前
|
存储 分布式计算 Hadoop
【Hadoop】Hadoop的三种集群模式
【4月更文挑战第9天】【Hadoop】Hadoop的三种集群模式
|
1月前
|
存储 分布式计算 资源调度
centos 部署Hadoop-3.0-高性能集群(二)
centos 部署Hadoop-3.0-高性能集群(二)
20 0
centos 部署Hadoop-3.0-高性能集群(二)
|
1月前
|
分布式计算 Hadoop Java
centos 部署Hadoop-3.0-高性能集群(一)安装
centos 部署Hadoop-3.0-高性能集群(一)安装
26 0

相关实验场景

更多