本节书摘来异步社区《IT运维之道》一书中的第3章,第3.4节,作者: 李鹏 责编: 张涛,更多章节内容可以访问云栖社区“异步社区”公众号查看。
3.4 落实整体运维
IT运维的第一件要事是按照IT运维服务的原则做事,第二件要事是将这些原则应用到IT运维服务工作当中,第三件要事是将运维落实到整个技术系统的每个环节中。为了方便读者理解,我们将常见的系统抽象为四个子系统来一一介绍,它们分别是软件支撑系统、应用系统、计算机硬件设备和机房及环境。
3.4.1 软件支撑系统运维
软件支撑系统是指为应用软件运行条件的软件环境包括操作系统、编译程序 、数据库管理系统 、中间件、各种高级语言等。如:针对信息系统服务器上部署的操作系统(如Windows、AIX、LINUX、HP)、数据库(如DB2、Oracle、SQL Server)、中间件(如WebSphere)、数据传输软件(如MQ)等,主要运维工作是提供日常例行检查、故障排除、系统软件升级、定期巡检、数据库性能调优、系统与中间件部署、系统软件维护培训等运维服务。
3.4.2 应用系统的运维
应用系统是指为特定用途所开发并可在生产环境执行的一个或多个应用程序,以及和程序一起产生的数据信息。
应用系统运维主要包括日常性维护、纠错性维护、适应性维护、完善性维护、操作性指导和技术培训、数据完整性维护及数据分析等。日常性维护:信息系统软件运行状态监控、日常检查、故障诊断与排除、日志管理、定期备份、垃圾信息清理、技术支持等日常性工作。纠错性维护:修正信息系统可能存在的软件缺陷和错误以及其他未曾预见的错误等。适应性维护:适应硬件环境和系统软件的变化而进行的性能检测调优、系统优化、配置变更等局部性修改。完善性维护:为扩充功能和改善性能而进行的一般性修改。操作性指导:为用户正常开展业务而提供的操作指导或帮助,指导用户按运行要求开展业务,并解答用户提出的各类咨询。技术培训:定期组织行业用户进行与信息系统应用操作与维护相关的技术培训,提升用户操作与维护技能。数据完整性维护及数据分析:应用系统安全性维护(安全保障的设备或系统软件,包括防火墙、入侵防范系统、安全审计系统、防病毒系统、终端安全管理系统等),信息内容服务型维护(包括信息采集、整理、编辑、制作、发布、挖掘、分析和安全管理等)。一般来讲,整个运维工作的核心是应用系统的维护,也是最难的部分,特别是对第三方运维商来说。
3.4.3 计算机硬件设备的运维
计算机硬件设备是指计算机系统中由电子、机械和光电元件等组成的各种物理装置的总称。这些物理装置按系统结构的要求构成一个有机整体为计算机软件运行提供物质基础。简言之,计算机硬件的功能是输入并存储程序和数据,以及执行程序把数据加工成可以利用的形式。从外观上来看,微机由主机箱和外部设备组成。主机箱内主要包括CPU、内存、主板、硬盘驱动器、光盘驱动器、各种扩展卡、连接线、电源等;外部设备包括鼠标、键盘、显示器、音箱等,这些设备通过接口和连接线与主机相连。
计算机硬件设备的运维包括针对PC电脑、平板电脑、服务器、存储设备、网络交换机以及其他计算机控制设备提供定期巡检、定期保养、故障诊断与排除以及备件的更换等运维服务。
3.4.4 机房及环境的运维
计算机机房普遍指的是电信、网通、移动、双线、电力以及政府或者企业等存放服务器、为用户以及员工提供IT服务的地方。
机房环境监测系统是一个综合计算机网络技术、数据库技术、通信技术、自动控制技术、新型传感技术等构成的计算机网络,提供一种以计算机技术为基础、基于集中管理监控模式的自动化、智能化和高效率的技术手段,系统监控对象主要是机房动力和环境设备等设备(如配电、UPS、空调、温湿度、漏水、烟雾、视频、门禁、防雷、消防系统等)。
机房及环境的运维主要针对机房中比较重要的设施(如配电、UPS、空调、温湿度、防水、烟雾、视频、门禁、防雷、消防系统等)进行全天候不间断的监控与预防性维护。