[绝对要收藏]配置hadoop完全分布式环境

简介: [绝对要收藏]配置hadoop完全分布式环境

##

环境:

hadoop-2.7.2,jdk1.8.0_144,CentOS-7-x86_64-Minimal-2009.iso

1 先创建一个主机

2 修改id,hostname,hosts

3 关闭防火墙

4 连接xshell

5 在opt下创建en和software包并将java导入到software包中

6 解压 java到en下

7 配置/etc/profile将java的环境加入进去

8 让文件生效并检测java环境是否配置成功

9 java -version

10 将主虚拟机关机

11 克隆3台虚拟机并把ip和hostname改掉重启

12 连接xshell

13 做免密

mkdir .ssh

ssh-keygen -t rsa

cd .ssh

在.ssh文件夹下进行免密秘钥生成并修改文件权限:

命令:

cat id_rsa.pub >> authorized_keys

文件权限修改

chmod 700 .ssh

chmod 600 .ssh/*

scp -r authorized_keys root@hadoop2:~/.ssh/ 从主节点到次节点

ssh-copy-id -i id_rsa.pub root@hadoop1          从次节点到主节点

14 配置好核心文件和hdfs文件

核心文件

<!-- 指定HDFS中NameNode的地址(第一台主机名) -->

<property>

       <name>fs.defaultFS</name>

     <value>hdfs://hadoop5:9000</value>

</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->

<property>

       <name>hadoop.tmp.dir</name>

       <value>/opt/en/hadoop-2.7.2/data/tmp</value>

</property>

HDFS文件

配置hadoop-env.sh

export JAVA_HOME=/opt/en/jdk1.8.0_144

配置hdfs-site.xml

<property>

       <name>dfs.replication</name>

       <value>3</value>

</property>

<!-- 指定Hadoop辅助名称节点主机配置(第二台主机名) -->

<property>

     <name>dfs.namenode.secondary.http-address</name>

     <value>hadoop6:50090</value>

</property>

15 向其他两个子节点分发hadoop文件夹,并将从节点的Hadoop环境配置好

scp  -r root hadoop2:/opt/en

16 第一次启动时,在主机格式化namenode,进入hadoop/bin文件下,执行

hadoop namenode -format

17 启动hadoop集群进入hadoop/sbin文件夹下,执行start-all.sh启动集群

18 打开50070端口

19 将测试文件内容上传到文件系统上

hadoop-2.7.2]$bin/hdfs dfs -put wcinput/wc.input  /input

相关文章
|
6天前
|
消息中间件 负载均衡 Java
如何设计一个分布式配置中心?
这篇文章介绍了分布式配置中心的概念、实现原理及其在实际应用中的重要性。首先通过一个面试场景引出配置中心的设计问题,接着详细解释了为什么需要分布式配置中心,尤其是在分布式系统中统一管理配置文件的必要性。文章重点分析了Apollo这一开源配置管理中心的工作原理,包括其基础模型、架构模块以及配置发布后实时生效的设计。此外,还介绍了客户端与服务端之间的交互机制,如长轮询(Http Long Polling)和定时拉取配置的fallback机制。最后,结合实际工作经验,分享了配置中心在解决多台服务器配置同步问题上的优势,帮助读者更好地理解其应用场景和价值。
35 18
|
2月前
|
数据库
如何在Seata框架中配置分布式事务的隔离级别?
总的来说,配置分布式事务的隔离级别是实现分布式事务管理的重要环节之一,需要认真对待和仔细调整,以满足业务的需求和性能要求。你还可以进一步深入研究和实践 Seata 框架的配置和使用,以更好地应对各种分布式事务场景的挑战。
53 6
|
3月前
|
分布式计算 Hadoop 大数据
大数据体系知识学习(一):PySpark和Hadoop环境的搭建与测试
这篇文章是关于大数据体系知识学习的,主要介绍了Apache Spark的基本概念、特点、组件,以及如何安装配置Java、PySpark和Hadoop环境。文章还提供了详细的安装步骤和测试代码,帮助读者搭建和测试大数据环境。
94 1
|
3月前
|
分布式计算 Hadoop Shell
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
Hadoop-35 HBase 集群配置和启动 3节点云服务器 集群效果测试 Shell测试
97 4
|
3月前
|
SQL 分布式计算 Hadoop
Hadoop-34 HBase 安装部署 单节点配置 hbase-env hbase-site 超详细图文 附带配置文件
Hadoop-34 HBase 安装部署 单节点配置 hbase-env hbase-site 超详细图文 附带配置文件
121 2
|
3月前
|
分布式计算 NoSQL Java
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
Hadoop-32 ZooKeeper 分布式锁问题 分布式锁Java实现 附带案例和实现思路代码
65 2
|
3月前
|
分布式计算 Hadoop
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
Hadoop-27 ZooKeeper集群 集群配置启动 3台云服务器 myid集群 zoo.cfg多节点配置 分布式协调框架 Leader Follower Observer
66 1
|
3月前
|
SQL NoSQL 安全
分布式环境的分布式锁 - Redlock方案
【10月更文挑战第2天】Redlock方案是一种分布式锁实现,通过在多个独立的Redis实例上加锁来提高容错性和可靠性。客户端需从大多数节点成功加锁且总耗时小于锁的过期时间,才能视为加锁成功。然而,该方案受到分布式专家Martin的质疑,指出其在特定异常情况下(如网络延迟、进程暂停、时钟偏移)可能导致锁失效,影响系统的正确性。Martin建议采用fencing token方案,以确保分布式锁的正确性和安全性。
63 0
|
3月前
|
NoSQL Java Redis
太惨痛: Redis 分布式锁 5个大坑,又大又深, 如何才能 避开 ?
Redis分布式锁在高并发场景下是重要的技术手段,但其实现过程中常遇到五大深坑:**原子性问题**、**连接耗尽问题**、**锁过期问题**、**锁失效问题**以及**锁分段问题**。这些问题不仅影响系统的稳定性和性能,还可能导致数据不一致。尼恩在实际项目中总结了这些坑,并提供了详细的解决方案,包括使用Lua脚本保证原子性、设置合理的锁过期时间和使用看门狗机制、以及通过锁分段提升性能。这些经验和技巧对面试和实际开发都有很大帮助,值得深入学习和实践。
太惨痛: Redis 分布式锁 5个大坑,又大又深, 如何才能 避开 ?
|
1月前
|
存储 NoSQL Java
使用lock4j-redis-template-spring-boot-starter实现redis分布式锁
通过使用 `lock4j-redis-template-spring-boot-starter`,我们可以轻松实现 Redis 分布式锁,从而解决分布式系统中多个实例并发访问共享资源的问题。合理配置和使用分布式锁,可以有效提高系统的稳定性和数据的一致性。希望本文对你在实际项目中使用 Redis 分布式锁有所帮助。
128 5