hadoop 安装系列教程二——伪分布式

简介: hadoop 安装系列教程二——伪分布式

1.安装Java jdk

vi /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_251

export CLASSPATH=.:JAVAHOME/lib/dt.jar:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar

export PATH=PATH:PATH:JAVA_HOME/bin

source /etc/profile

2.安装hadoop

步骤一:下载 https://hadoop.apache.org/releases.html

步骤二:配置环境变量

vi /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_251

export HADOOP_HOME=/opt/hadoop-2.9.2

export CLASSPATH=.:JAVAHOME/lib/dt.jar:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar

export PATH=PATH:PATH:JAVA_HOME/bin:HADOOPHOME/bin:HADOOP_HOME/bin:HADOOP_HOME/sbin

source /etc/profile

测试:配置成功

步骤三:免密登录

(1)生成秘钥

ssh-keygen -t dsa  -f ~/.ssh/id_dsa

(2) 公钥存储

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

测试:ssh localhost

步骤四:修改配置文件,hadoop伪分布模式需要修改5个配置文件,配置文件目录为/opt/hadoop-2.9.2/etc/hadoop

(1)hadoop-env.sh

export JAVA_HOME=/opt/jdk1.8.0_251

(2)core-site.xml

fs.default.name

hdfs://127.0.0.1:9000

hadoop.tmp.dir

/data/hadoop/tmp

(3)hdfs-site.xml

dfs.namenode.name.dir

file:/data/hadoop/hdfs/name

dfs.datanode.name.dir

file:/data/hadoop/hdfs/data

dfs.replication

1

(4)修改mapred-site.xml,首先去掉.template后缀,指令:mv mapred-site.xml.template mapred-site.xml

mapreduce.framework.name

yarn

(5)yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

步骤五:格式化HDFS文件系统 /opt/hadoop-2.9.2/bin

./hdfs namenode -format

步骤六:启动 /opt/hadoop-2.9.2/sbin

./start-all.sh

测试是否成功 jps

访问地址:

http://ip:8088/

http://ip:50070/



相关文章
|
22天前
|
SQL 分布式计算 关系型数据库
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
27 2
|
1月前
|
分布式计算 Hadoop 大数据
【大数据】Hadoop下载安装及伪分布式集群搭建教程
【大数据】Hadoop下载安装及伪分布式集群搭建教程
80 0
|
2月前
|
弹性计算 分布式计算 Hadoop
Linux(阿里云)安装Hadoop(详细教程+避坑)
Linux(阿里云)安装Hadoop(详细教程+避坑)
394 3
|
2月前
|
存储 分布式计算 Hadoop
【分布式计算框架】Hadoop伪分布式安装
【分布式计算框架】Hadoop伪分布式安装
23 2
|
2月前
|
分布式计算 Hadoop Java
hadoop的基础设施-protobuf-2.5.0编译和安装
hadoop的基础设施-protobuf-2.5.0编译和安装
29 0
|
2月前
|
分布式计算 Hadoop 数据安全/隐私保护
现成Hadoop安装和配置,图文手把手交你
现成Hadoop安装和配置,图文手把手交你
|
分布式计算 Ubuntu Hadoop
Hadoop 的安装和使用(基于Linux~Ubuntu的虚拟机)
Hadoop 的安装和使用(基于Linux~Ubuntu的虚拟机)
952 0
Hadoop 的安装和使用(基于Linux~Ubuntu的虚拟机)
|
1月前
|
分布式计算 Hadoop 分布式数据库
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
Hadoop生态系统介绍(二)大数据技术Hadoop入门理论系列之一----hadoop生态圈介绍
100 2
|
1月前
|
存储 分布式计算 Hadoop
Spark和Hadoop都是大数据处理领域的重要工具
【6月更文挑战第17天】Spark和Hadoop都是大数据处理领域的重要工具
138 59
|
26天前
|
分布式计算 Hadoop Java
优化大数据处理:Java与Hadoop生态系统集成
优化大数据处理:Java与Hadoop生态系统集成