Hadoop单机模式部署

简介:

一、Hadoop部署模式

单机模式:默认情况下运行为一个单独机器上的独立Java进程,主要用于调试环境

伪分布模式:在单个机器上模拟成分布式多节点环境,每一个Hadoop守护进程都作为一个独立的Java进程运行

完全分布式模式:真实的生产环境,搭建在完全分布式的集群环境


二、添加用户和组

1
2
sudo  adduser hadoop                          ##创建用户hadoop
sudo  usermod  -G  sudo  hadoop                    ##将hadoop用户添加进sudo用户组


三、安装相关软件

1
2
3
4
sudo  apt-get update
sudo  apt-get -y  install  openssh-server  rsync  openjdk-7-jdk
sudo  service  ssh  restart
$ java -version

wKiom1ZqdkLT79muAAAYyRv7iTA099.png


四、配置SSH免密登录

1
2
3
4
su  -l hadoop                              ##切换至hadoop用户
ssh -keygen -t rsa -P  ""                    ##配置SSH免密登录
cat  ~/. ssh /id_rsa .pub >> ~/. ssh /authorized_keys     ##将公钥追加到authorized_keys中
ssh  localhost                            ##验证


五、Hadoop配置


①下载安装Hadoop

1
2
3
4
su  -l hadoop
$ wget http: //apache .fayea.com /hadoop/common/hadoop-2 .7.1 /hadoop-2 .7.1. tar .gz 
tar  -zxvf hadoop-2.7.1. tar .gz
sudo  mv  hadoop-2.7.1  /usr/local/hadoop

wKiom1ZqfYHjL61cAAATfLrD9O4929.png


②配置Hadoop

a.添加环境变量

1
2
3
4
5
6
7
8
9
10
11
12
13
14
vi  /home/hadoop/ .bashrc
#HADOOP START
export  JAVA_HOME= /usr/lib/jvm/java-7-openjdk-amd64
export  HADOOP_INSTALL= /usr/local/hadoop/
export  PATH=$PATH:$HADOOP_INSTALL /bin
export  PATH=$PATH:$HADOOP_INSTALL /sbin
export  HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export  HADOOP_COMMON_HOME=$HADOOP_INSTALL
export  HADOOP_HDFS_HOME=$HADOOP_INSTALL
export  YARN_HOME=$HADOOP_INSTALL
export  HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL /lib/native
export  HADOOP_OPTS= "-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP END
$ .   /home/hadoop/ .bashrc     ##重载使其生效

wKiom1ZqfQSQy-7EAAA_xMvga78946.png


六、测试

①创建输入数据

1
2
3
4
su  -l hadoop
cd  /usr/local/hadoop
sudo  mkdir  input
sudo  cp  /etc/passwd  input/


②执行Hadoop WordCount应用(词频统计)

1
$ bin /hadoop  jar share /hadoop/mapreduce/sources/hadoop-mapreduce-examples-2 .7.1-sources.jar org.apache.hadoop.examples.WordCount input output

wKiom1ZqhXmw05xGAABwmLjxay4549.png


③查看生成的单词统计数据

1
2
3
4
$ hadoop dfs - ls  output
-rw-r--r--   1 hadoop hadoop          0 2015-12-18 13:18 output /_SUCCESS
-rw-r--r--   1 hadoop hadoop       2128 2015-12-18 13:18 output /part-r-00000
$ hadoop dfs - cat  output/*


:

配置单节点Hadoop的文档:http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html#Standalone_Operation



本文转自  结束的伤感  51CTO博客,原文链接:http://blog.51cto.com/wangzhijian/1765696


相关文章
|
2月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
193 6
|
2月前
|
分布式计算 资源调度 Hadoop
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
大数据-80 Spark 简要概述 系统架构 部署模式 与Hadoop MapReduce对比
83 2
|
1月前
|
分布式计算 资源调度 Hadoop
【赵渝强老师】部署Hadoop的本地模式
本文介绍了Hadoop的目录结构及本地模式部署方法,包括解压安装、设置环境变量、配置Hadoop参数等步骤,并通过一个简单的WordCount程序示例,演示了如何在本地模式下运行MapReduce任务。
|
2月前
|
SQL 存储 数据管理
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
Hadoop-15-Hive 元数据管理与存储 Metadata 内嵌模式 本地模式 远程模式 集群规划配置 启动服务 3节点云服务器实测
66 2
|
4月前
|
存储 分布式计算 算法
探索Hadoop的三种运行模式:单机模式、伪分布式模式和完全分布式模式
在配置Hadoop集群之前,了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况,选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段,单机模式和伪分布式模式能为用户提供便利和成本效益。进而,当用户要处理大规模数据集时,完全分布式模式将是理想的选择。
299 2
|
4月前
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
|
4月前
|
分布式计算 Ubuntu Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
|
4月前
|
分布式计算 Ubuntu Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
45 1
|
4月前
|
存储 分布式计算 Hadoop
Hadoop 运行的三种模式
【8月更文挑战第31天】
536 0
|
4月前
|
SQL 分布式计算 Hadoop
centos7通过CDH部署Hadoop
centos7通过CDH部署Hadoop

相关实验场景

更多