服务器搬迁之后的准备工作和应对

简介:   服务器搬迁后不是简单能连接上服务器就可以了,还有许多的事情需要考虑,否则服务器不可用还是白搭。   我大体碰到了如下的一些问题,也能够反应出来对于系统的各种潜在隐患。

  服务器搬迁后不是简单能连接上服务器就可以了,还有许多的事情需要考虑,否则服务器不可用还是白搭。

  我大体碰到了如下的一些问题,也能够反应出来对于系统的各种潜在隐患。

1

  批量检测服务器的可用状态

  如果有大批量的服务器搬迁,有些能够连通,有些不可以,使用telnet本身就有硬伤,我们直接设置个超时时间,对于服务是否可用一目了然。这个时候还是推荐使用nc命令。比如测试服务器10.129.128.37的22端口是否可通,超时时间为2秒,则可以使用如下的命令。

nc -z -v -n -w 2 10.129.128.37 22

2

 检查ILO的连接情况

   如果ILO(iDRAC)都不可用,那么基本上可以保证你的这个服务器就不可用了。没有了终极控制权,即使可以连接,但是一旦服务器出现异常就完全不可控,这个时候尤其注意的是密码,要知道密码。

3

 检查root密码的情况

   检查root密码的重要性不言而喻,如果能够访问到服务器,但是你压根登录不了,没有任何预想准备的用户,那么这个也可以给服务器“判刑”了。修改root密码本身不是件容易的事情,通过各种设置,如果在关键步骤还需要密码呢。


4

防火墙信息丢失

这样的情况碰到了几次,服务器重启之后原本能连接的连不上了,这个时候的解决方法还是ILO的连接到服务器端,然后手工开启,或者给自己留点余地,给主库或者备库开启访问的权限,这样即使中控权限丢失,也还能保证能够连接。

5

使用硬IP绑定而非主机域名绑定

有些系统会设置自动启动监听,很可能服务器无法开启自启动,其中的一个主要原因就是使用了硬IP绑定,在listener.ora里面如果使用主机域名解析就会省事很多。

或者对于mysql而言,这个问题就会被放大,比如下面的一个slave服务器启动之后,无法连接到主库应用binlog,经过排查,主要的一个原因就是对于用户权限的配置使用了硬IP配置,如果使用域名绑定就会方便多了。

slave的错误信息如下:

 2017-07-26 03:55:34 2490 [ERROR] Slave I/O: error connecting to master 'rep_live800@live800.test.com:3306' - retry-time: 5  retries: 5, Error_code: 1130
2017-07-26 03:55:39 2490 [ERROR] Slave I/O: error connecting to master 'rep_live800@live800.test.com:3306' - retry-time: 5  retries: 6, Error_code: 1130
update mysql.user set host='xxxx' where user='xxx';

这个时候刷新权限就能够正常连接了。

--flush privileges

查看slave的日志如下:

2017-07-26 03:55:44 2490 [Note] Slave I/O thread: connected to master 'rep_live800@live800.test.com:3306',replication started in log 'binlog.000019' at position 818554844


6

工具的配置问题

如果使用oracle的DG broker配置,如果本身存在一些配置的问题或者就是DG Broker在早期版本不够强大,很可能会出现一些问题。

比如下面的DG Broker配置总是失败,就是的问题,最后重新配置DG Broker就可以了。

Data Guard Broker terminating NSV3, timed out waiting for a response from database s3accdb0
07/26/2017 09:13:18
Data Guard Broker terminating NSV3, timed out waiting for a response from database s3accdb0
07/26/2017 09:13:37


7

数据库无法启动

数据库在启动时很可能失败,可能因为僵尸进程,可能因为内核参数配置的问题。比如下面的这个问题。


idle> startup mount
ORA-27102: out of memory
Linux-x86_64 Error: 28: No space left on device
而错误的原因就在于内存中的僵尸进程依旧存在,还没有释放。

$ ps -ef|grep smon
oracle    5374  4967  0 12:58 pts/0    00:00:00 grep smon
oracle   24710     1  0 Jul25 ?        00:00:00 ora_smon_statdb1

手工释放,重启就可以了。

8

数据库文件丢失

数据库如果你启动服务器之后,突然发现数据全都丢失了,sqlplus,mysql完全不可用,先不要着急,你可以看看是不是分区没有挂载。









目录
相关文章
|
4月前
|
存储 数据挖掘 Linux
服务器数据恢复—机房搬迁导致服务器无法识别raid的数据恢复案例
某单位机房搬迁,将所有服务器和存储搬迁到新机房并重新连接线路,启动所有机器发现其中有一台服务器无法识别RAID,提示未做初始化操作。 发生故障的这台服务器安装LINUX操作系统,配置了NFS+FTP作为单位内部的文件服务器使用。服务器为ProLiant DL380系列服务器,通过hp smart array控制器挂载了一组由14块SCSI硬盘组成的RAID5磁盘阵列。该raid5磁盘阵列采用双循环的校验方式。 北亚企安数据恢复工程师到达现场后对故障服务器进行了初检,经过检测发现raid信息丢失。
服务器数据恢复—机房搬迁导致服务器无法识别raid的数据恢复案例
|
6月前
|
监控 安全 Linux
【专栏】拿到一台新的物理服务器,有几项关键的准备工作和安全措施是必须要做的
【4月更文挑战第28天】新服务器部署前,需进行系统初始化(安装OS、网络配置、用户管理)、安全加固(更新补丁、关闭不必要的服务、防火墙设置)和性能优化(调整内核参数、文件系统优化)。同时,设置监控系统(如Nagios)以检查硬件和软件资源,制定备份策略确保数据安全。这些步骤确保服务器稳定、安全、高效运行。
239 1
|
弹性计算 UED
弹性计算Clouder认证:服务器迁移上云——课时5:迁移前需要完成那些准备工作?
弹性计算Clouder认证:服务器迁移上云——课时5:迁移前需要完成那些准备工作?
|
安全 Java 关系型数据库
案例之创建资源服务器准备工作|学习笔记
快速学习案例之创建资源服务器准备工作
案例之创建资源服务器准备工作|学习笔记
|
弹性计算 NoSQL Linux
使用ECS的准备工作
部署博客项目做得准备
|
Java
构建与服务器的JDK版本不同,导致服务器不能工作
将原来的工作空间复制过来,全构建成功。将产生的WAR包复制到服务器,结果死活不能运行。那肯定是代码有问题啦,于是将代码进行了反复比较,确保没有差异,然后编译、复制,死活不行。这是怎么回事?
170 0
|
存储 弹性计算 缓存
直播代码是如何工作的,不同服务器之间的区别
简单来说直播的原理就是把主播录好的内容实时推送到服务器,再由服务器分发给各个用户进行观看。直播发展到如今,由PC端的网页版直播到如今的移动端直播,越来越多直播功能的APP上线,直播的服务器分为很多种类,那么不同的服务器之间有哪些差异呢?本文来为大家简单介绍一下。 服务器在网络中为其它客户机提供计算或者应用服务。服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。
直播代码是如何工作的,不同服务器之间的区别
|
关系型数据库 Apache 数据库
下一篇
无影云桌面