开发者社区> jeanron100> 正文

数据库相关的系统巡检参考项

简介: 快过春节了,对于巡检工作真是非常重要的一环,也是考验巡检的力度的一种方式,及早发现问题,及时解决,就会避免很多“到时候再说”的问题。 当然公司层面也有一些巡检要求,我自己也总结了一下,发现还是需要写一部分,然后不断完善。
+关注继续查看
快过春节了,对于巡检工作真是非常重要的一环,也是考验巡检的力度的一种方式,及早发现问题,及时解决,就会避免很多“到时候再说”的问题。
当然公司层面也有一些巡检要求,我自己也总结了一下,发现还是需要写一部分,然后不断完善。主要分为下面的几个部分来阐述。

检查ILO可用性和使用情况

    如果拥有对服务器资源的管理权限,对于ILO还是要验证一下,大体有几种情况。

ILO模块没有开启

这个可以联系系统组的同学帮你开启,也可以参考下面的步骤。

    # modprobe ipmi_watchdog

    # modprobe ipmi_poweroff

    # modprobe ipmi_devintf

    # chkconfig  ipmi  on

ILO密码错误

    可以使用下面的命令来重置密码

     /usr/bin/ipmitool user set password 2 'xunjian'

ILO超过最大用户连接数限制

     如果用户名,密码正确,如果上一次登录没有正常退出,可能会有下面的报错。

     RAC0218:已达到用户会话的最大数

    这个时候可以重启ILO来达到目标。

        ipmitool mc reset cold,这个过程会持续几分钟。

ILO在不同的硬件产品版本和浏览器的兼容性   

   ILO在不同的硬件产品版本中浏览器也有一些使用差异,有些版本使用IE低版本可以,有些可以使用chrome,firefox,有些则不适用。

ILO页面和JAVA的版本关系

   这两点比较微妙,但是在实际中碰到问题的时候更多,特别是对于Java,如果查看新版本的硬件,JAVA8是不推荐的,因为安全策略太高,手工还修改不了这个设置,得用JAVA7及以下的版本了。

操作系统版本

   操作系统的版本也需要提前规划,如果有些服务的版本过旧,需要考虑升级到一个较新的稳定版本,目前来看6U5还是值得推荐。在redhat5及以下的版本,碰到了不少的小问题。

操作系统内核参数

操作系统内核参数可以作为一个重要的检查项,当然对于主库而言可能重启不现实,但是提前准备好,在下次重启的时候能够省事省力,对于备库而言,也可以提早准备。

检查操作系统防火墙情况

    对于操作系统中的防火墙设定最好能够提供完整的备份,到时候可以在灾备切换的时候用到。

    如果存在特殊的网络设置情况,需要提前标注,要不帮你处理问题的同事会踩到一大坑。

系统文件权限

    对于部分文件,需要考虑文件的权限,保证不会恶意篡改。比如设定这些关键文件和配置文件的只读权限,比如/etc/passwd,/etc/shadow,/etc/group等等

swap使用情况

     swap的监控还是比较重要,对于Oracle来说,还是大SGA建议开启大页,要不swap争用较高,如果剩余内存不足,很容易触发oom-killer

文件的分区和规划情况

    对于文件的分区和使用情况也需要格外关注,对于一些过旧的历史文件可以压缩或者删除。是否还在使用很陈旧的文件系统。

硬盘坏块和硬盘问题

     硬盘坏块和硬盘问题还是很重要,只是硬盘没问题,哪怕其它的硬件问题规避不了,数据至少还是没问题的。

查看crontab的执行情况

    查看例行的执行任务是否正常,比较尴尬的是crontab运行了,但是什么都没有干,比如删除归档,发现一直在扫描一个空目录,而真正的归档目录已经快撑爆了。

备份保留情况,是否有异机备份

   这个需要结合目前的系统使用情况,如果数据库是非归档,测试环境,可以考虑异机备份。对于一些关键业务,在有灾备的情况下,也可以额外增加部分的逻辑备份。 

时间同步设置ntp

使用nftp同步时间的部分需要考虑。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
openGauss基于自定义条件下的高级恢复
openGauss基于自定义条件下的高级恢复
31 0
【数据库】C#创建项目简单开发实现数据库表记录迁移功能
在实际项目中,很大可能会遇到数据迁移的情况 特别是对于系统升级或者旧表转移到新表,新旧表很可能是字段都不一样的情况,本篇文章就是在两个不同数据库不同表之间数据整合 同时也回顾下ADO.NET的ORM框架基础知识
35 0
数据库开发概览和设备运行数据库方案设计
  基于数据库的应用平台是最常用的平台,比如大家订票用的网站12306,火车票和订票用户信息都是保存在数据库里。12306第一版本不太好用,也和它的数据库设计和开发不到位有一定关系。   数据库开发有简单的层次,比如面向一个表实现简单的增删改查,这些通过SQL开发技术来实现不麻烦。   数据库开发中级层次涉及到存储过程开发和TSQL开发,存储过程是数据库系统里的一类对象,TSQL是存储过程的开发语言。存储过程在服务器端执行多条命令,比在客户端执行多条命令效率快。   数据库高级开发相关的有内存数据库、复杂硬件平台和非关系数据库,内存数据库支持实时性要求高的环境,复杂硬件平台用于支持数据量
116 0
数据库巡检项
ORACLE db_cache_size 无steal情况; shared_pool_size 无steal情况; free memory大于1024M; pga_aggregate_target 无overallco情况; log_buffer ...
1040 0
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 28 章 监控数据库活动_28.5. 动态追踪
28.5. 动态追踪 28.5.1. 动态追踪的编译 28.5.2. 内建探针 28.5.3. 使用探针 28.5.4. 定义新探针 PostgreSQL提供了功能来支持数据库服务器的动态追踪。
1217 0
PostgreSQL 10.1 手册_部分 III. 服务器管理_第 28 章 监控数据库活动_28.4. 进度报告
28.4. 进度报告 28.4.1. VACUUM进度报告 PostgreSQL能够在命令执行期间报告某些命令的进度。目前,唯一支持 进度报告的命令是VACUUM。未来可能会添加更多命令支持。
1171 0
+关注
jeanron100
Oracle ACE,《Oracle DBA工作笔记》作者 现就职于国内某互联网公司,擅长数据管理,数据迁移,性能优化,目前专注于开源技术,运维自动化和性能优化。
文章
问答
文章排行榜
最热
最新
相关电子书
更多
数据库智能优化系统的探索与实践
立即下载
高可用数据库的搭建与备份恢复策略验证实战
立即下载
阿里云数据库产品手册
立即下载