hadoop 安装系列教程二——伪分布式

简介: hadoop 安装系列教程二——伪分布式

1.安装Java jdk

vi /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_251

export CLASSPATH=.:JAVAHOME/lib/dt.jar:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar

export PATH=PATH:PATH:JAVA_HOME/bin

source /etc/profile

2.安装hadoop

步骤一:下载 https://hadoop.apache.org/releases.html

步骤二:配置环境变量

vi /etc/profile

export JAVA_HOME=/opt/jdk1.8.0_251

export HADOOP_HOME=/opt/hadoop-2.9.2

export CLASSPATH=.:JAVAHOME/lib/dt.jar:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar

export PATH=PATH:PATH:JAVA_HOME/bin:HADOOPHOME/bin:HADOOP_HOME/bin:HADOOP_HOME/sbin

source /etc/profile

测试:配置成功

步骤三:免密登录

(1)生成秘钥

ssh-keygen -t dsa  -f ~/.ssh/id_dsa

(2) 公钥存储

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

测试:ssh localhost

步骤四:修改配置文件,hadoop伪分布模式需要修改5个配置文件,配置文件目录为/opt/hadoop-2.9.2/etc/hadoop

(1)hadoop-env.sh

export JAVA_HOME=/opt/jdk1.8.0_251

(2)core-site.xml

fs.default.name

hdfs://127.0.0.1:9000

hadoop.tmp.dir

/data/hadoop/tmp

(3)hdfs-site.xml

dfs.namenode.name.dir

file:/data/hadoop/hdfs/name

dfs.datanode.name.dir

file:/data/hadoop/hdfs/data

dfs.replication

1

(4)修改mapred-site.xml,首先去掉.template后缀,指令:mv mapred-site.xml.template mapred-site.xml

mapreduce.framework.name

yarn

(5)yarn-site.xml

yarn.nodemanager.aux-services

mapreduce_shuffle

步骤五:格式化HDFS文件系统 /opt/hadoop-2.9.2/bin

./hdfs namenode -format

步骤六:启动 /opt/hadoop-2.9.2/sbin

./start-all.sh

测试是否成功 jps

访问地址:

http://ip:8088/

http://ip:50070/



相关文章
|
2月前
|
分布式计算 Hadoop Java
Hadoop集群搭建,基于3.3.4hadoop和centos8【图文教程-从零开始搭建Hadoop集群】,常见问题解决
本文是一份详细的Hadoop集群搭建指南,基于Hadoop 3.3.4版本和CentOS 8操作系统。文章内容包括虚拟机创建、网络配置、Java与Hadoop环境搭建、克隆虚拟机、SSH免密登录设置、格式化NameNode、启动Hadoop集群以及通过UI界面查看Hadoop运行状态。同时,还提供了常见问题的解决方案。
Hadoop集群搭建,基于3.3.4hadoop和centos8【图文教程-从零开始搭建Hadoop集群】,常见问题解决
|
1月前
|
SQL 分布式计算 Hadoop
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
60 3
|
3月前
|
分布式计算 资源调度 Hadoop
centos7二进制安装Hadoop3
centos7二进制安装Hadoop3
|
3月前
|
存储 分布式计算 算法
探索Hadoop的三种运行模式:单机模式、伪分布式模式和完全分布式模式
在配置Hadoop集群之前,了解这三种模式的特点、适用场景和配置差异是非常重要的。这有助于用户根据个人需求和资源情况,选择最适合自己的Hadoop运行模式。在最初的学习和开发阶段,单机模式和伪分布式模式能为用户提供便利和成本效益。进而,当用户要处理大规模数据集时,完全分布式模式将是理想的选择。
188 2
|
3月前
|
分布式计算 资源调度 Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(二)
|
3月前
|
分布式计算 Ubuntu Hadoop
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
Hadoop入门基础(二):Hadoop集群安装与部署详解(超详细教程)(一)
|
3月前
|
分布式计算 Ubuntu Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
在Ubuntu 16.04上如何在独立模式下安装Hadoop
35 1
|
4月前
|
SQL 分布式计算 关系型数据库
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
Hadoop-12-Hive 基本介绍 下载安装配置 MariaDB安装 3台云服务Hadoop集群 架构图 对比SQL HQL
70 2
|
5月前
|
分布式计算 Hadoop 大数据
【大数据】Hadoop下载安装及伪分布式集群搭建教程
【大数据】Hadoop下载安装及伪分布式集群搭建教程
224 0
|
1月前
|
分布式计算 Kubernetes Hadoop
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
大数据-82 Spark 集群模式启动、集群架构、集群管理器 Spark的HelloWorld + Hadoop + HDFS
151 6