Hadoop运行模式(五)、编写Hadoop集群常用脚本、Hadoop集群启停脚本、常用端口号说明、集群时间同步、时间服务器配置、其他机器配置

简介: Hadoop运行模式(五)、编写Hadoop集群常用脚本、Hadoop集群启停脚本、常用端口号说明、集群时间同步、时间服务器配置、其他机器配置

@[toc]

3.Hadoop运行模式

3.9编写Hadoop集群常用脚本

3.9.1Hadoop集群启停脚本(包含HDFS,Yarn,Historyserver):myhadoop.sh

  • [summer@hadoop102 ~]$ cd /home/summer/bin
  • [summer@hadoop102 bin]$ vim myhadoop.sh

在这里插入图片描述

在这里插入图片描述
输入如下内容:

#!/bin/bash

if [ $# -lt 1 ]
then
    echo "No Args Input..."
    exit ;
fi

case $1 in
"start")
        echo " =================== 启动 hadoop集群 ==================="

        echo " --------------- 启动 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/sbin/start-dfs.sh"
        echo " --------------- 启动 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop-3.1.3/sbin/start-yarn.sh"
        echo " --------------- 启动 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/bin/mapred --daemon start historyserver"
;;
"stop")
        echo " =================== 关闭 hadoop集群 ==================="

        echo " --------------- 关闭 historyserver ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/bin/mapred --daemon stop historyserver"
        echo " --------------- 关闭 yarn ---------------"
        ssh hadoop103 "/opt/module/hadoop-3.1.3/sbin/stop-yarn.sh"
        echo " --------------- 关闭 hdfs ---------------"
        ssh hadoop102 "/opt/module/hadoop-3.1.3/sbin/stop-dfs.sh"
;;
*)
    echo "Input Args Error..."
;;
esac

保存后退出,然后赋予脚本执行权限

  • [summer@hadoop102 bin]$ chmod 777 myhadoop.sh

3.9.1.1测试

  • [summer@hadoop102 bin]$ myhadoop.sh stop

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • [summer@hadoop102 bin]$ myhadoop.sh start

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

由于再查jps的时候每台服务器都需要输入命令,太麻烦了,因此写下面的脚本方便查jps

3.9.2查看三台服务器Java进程脚本:jpsall

  • [summer@hadoop102 bin]$ vim jpsall

在这里插入图片描述
保存后退出,然后赋予脚本执行权限

  • [summer@hadoop102 bin]$ chmod 777 jpsall

3.9.2.1测试结果

在这里插入图片描述

3.9.3分发/home/atguigu/bin目录,保证自定义脚本在三台机器上都可以使用

  • [summer@hadoop102 ~]$ xsync /home/summer/bin/

在这里插入图片描述

在这里插入图片描述

3.10常用端口号说明

端口名称 Hadoop2.x Hadoop3.x
NameNode内部通信端口 8020 / 9000 8020 / 9000/9820
NameNode HTTP UI 50070 9870
MapReduce查看执行任务端口 8088 8088
历史服务器通信端口 19888 19888

3.11集群时间同步

如果服务器在公网环境(能连接外网),可以不采用集群时间同步,因为服务器会定期和公网时间进行校准;
如果服务器在内网环境,必须要配置集群时间同步,否则时间久了,会产生时间偏差,导致集群执行任务时间不同步。

3.11.1需求

找一个机器,作为时间服务器,所有的机器与这台集群时间进行定时的同步,生产环境根据任务对时间的准确程度要求周期同步。测试环境为了尽快看到效果,采用1分钟同步一次。
在这里插入图片描述

3.11.2时间服务器配置(必须root用户)

3.11.2.1查看所有节点ntpd服务状态和开机自启动状态

  • [root@hadoop102 ~]# systemctl status ntpd
  • [root@hadoop102 ~]# systemctl start ntpd
  • [root@hadoop102 ~]# systemctl is-enabled ntpd

3.11.2.2修改hadoop102的ntp.conf配置文件

  • [root@hadoop102 ~]# vim /etc/ntp.conf

修改内容如下

3.11.2.2.1修改1(授权192.168.159.0-192.168.159.255网段上的所有机器可以从这台机器上查询和同步时间)

restrict 192.168.159.0 mask 255.255.255.0 nomodify notrap

为restrict 192.168.159.0 mask 255.255.255.0 nomodify notrap
取消注释

3.11.2.2.2修改2(集群在局域网中,不使用其他互联网上的时间)
server 0.centos.pool.ntp.org iburst
server 1.centos.pool.ntp.org iburst
server 2.centos.pool.ntp.org iburst
server 3.centos.pool.ntp.org iburst

server 0.centos.pool.ntp.org iburst

server 1.centos.pool.ntp.org iburst

server 2.centos.pool.ntp.org iburst

server 3.centos.pool.ntp.org iburst

3.11.2.2.3添加3(当该节点丢失网络连接,依然可以采用本地时间作为时间服务器为集群中的其他节点提供时间同步)

在最后添加
server 127.127.1.0
fudge 127.127.1.0 stratum 10

3.11.2.3修改hadoop102的/etc/sysconfig/ntpd文件

  • [root@hadoop102 ~]# vim /etc/sysconfig/ntpd

增加内容如下(让硬件时间与系统时间一起同步)
SYNC_HWCLOCK=yes

3.11.2.4重新启动ntpd服务

  • [root@hadoop102 ~]# systemctl start ntpd

3.11.2.5设置ntpd服务开机启动

  • [root@hadoop102 ~]# systemctl enable ntpd

3.11.3其他机器配置(必须root用户)

3.11.3.1关闭所有节点上ntp服务和自启动

  • [root@hadoop103 ~]# systemctl stop ntpd
  • [root@hadoop103 ~]# systemctl disable ntpd
  • [root@hadoop104 ~]# systemctl stop ntpd
  • [root@hadoop104 ~]# systemctl disable ntpd

3.11.3.2在其他机器配置1分钟与时间服务器同步一次

  • [root@hadoop104 ~]# crontab -e

编写定时任务如下:

*/1 * * * * /usr/sbin/ntpdate hadoop102

3.11.3.3修改任意机器时间

  • [root@hadoop104 ~]# date -s "2022-8-7 22:11:11"

3.11.3.4 1分钟后查看机器是否与时间服务器同步

  • [root@hadoop104 ~]# date
相关文章
|
6天前
|
数据采集 分布式计算 监控
Hadoop集群长时间运行数据倾斜原因
【6月更文挑战第20天】
17 6
|
6天前
|
分布式计算 监控 网络协议
Hadoop集群长时间运行网络延迟原因
【6月更文挑战第20天】
11 2
|
3天前
|
弹性计算 缓存 安全
阿里云服务器ECS收费标准参考,2核4G配置ECS实例规格整理
阿里云提供多种2核4G ECS实例,如计算型c7、经济型e、u1等,价格不等,从68.0元/月到203.0元/月。ECS通用算力型u1实例采用高性能Intel处理器,网络收发包能力达30万PPS。经济型e实例基于Intel Xeon Platinum,适合入门级需求。2核4G服务器支持的并发访问人数依赖于软件效率、带宽、应用架构和用户行为等因素。更多信息请查看阿里云ECS产品页。
|
1天前
|
数据采集 分布式计算 监控
Hadoop数据倾斜配置调整
【7月更文挑战第2天】
6 1
|
4天前
|
存储 缓存 运维
云计算中的服务器选型与配置:技术深度解析
【6月更文挑战第29天】云计算服务器选型与配置深度解析:关注业务需求、技术要求及成本效益。重点包括CPU、内存、存储和网络配置的优化,结合负载均衡、缓存、虚拟化和自动化运维策略,以提升性能和效率,确保云服务的稳定与高效。
|
6天前
|
存储 缓存 分布式计算
|
7天前
|
前端开发 小程序 应用服务中间件
在服务器上正确配置域名https证书(ssl)及为什么不推荐使用宝塔申请免费ssl证书
在服务器上正确配置域名https证书(ssl)及为什么不推荐使用宝塔申请免费ssl证书
43 4
|
7天前
|
存储 分布式计算 负载均衡
Hadoop集群长时间运行
【6月更文挑战第19天】
14 3
|
1天前
|
存储 NoSQL 关系型数据库
MongoDB的配置服务器和复制机制
【7月更文挑战第2天】MongoDB配置服务器存储分片和权限元数据,支持在主节点故障时保持读服务。关键组件,性能影响显著。复制集包含Primary和Secondary,通过oplog实现数据同步,类似MySQL binlog。oplog的幂等性可能导致大量set操作,且大小受限,可能导致从节点需全量同步。读写分离提升效率,主从切换确保高可用。
3 0
|
4天前
|
弹性计算 安全 Shell
阿里云ECS安全加固:从访问控制到数据保护的全方位策略
【6月更文挑战第29天】阿里云ECS安全聚焦访问控制、系统加固及数据保护。安全组限定IP和端口访问,密钥对增强SSH登录安全;定期更新补丁,使用防病毒工具;数据备份与加密确保数据安全。多维度策略保障业务安全。
34 15