《IT运维之道》一3.4 落实整体运维

简介:

本节书摘来异步社区《IT运维之道》一书中的第3章,第3.4节,作者: 李鹏 责编: 张涛,更多章节内容可以访问云栖社区“异步社区”公众号查看。

3.4 落实整体运维

IT运维的第一件要事是按照IT运维服务的原则做事,第二件要事是将这些原则应用到IT运维服务工作当中,第三件要事是将运维落实到整个技术系统的每个环节中。为了方便读者理解,我们将常见的系统抽象为四个子系统来一一介绍,它们分别是软件支撑系统、应用系统、计算机硬件设备和机房及环境。

3.4.1 软件支撑系统运维
软件支撑系统是指为应用软件运行条件的软件环境包括操作系统、编译程序 、数据库管理系统 、中间件、各种高级语言等。如:针对信息系统服务器上部署的操作系统(如Windows、AIX、LINUX、HP)、数据库(如DB2、Oracle、SQL Server)、中间件(如WebSphere)、数据传输软件(如MQ)等,主要运维工作是提供日常例行检查、故障排除、系统软件升级、定期巡检、数据库性能调优、系统与中间件部署、系统软件维护培训等运维服务。

3.4.2 应用系统的运维
应用系统是指为特定用途所开发并可在生产环境执行的一个或多个应用程序,以及和程序一起产生的数据信息。

应用系统运维主要包括日常性维护、纠错性维护、适应性维护、完善性维护、操作性指导和技术培训、数据完整性维护及数据分析等。日常性维护:信息系统软件运行状态监控、日常检查、故障诊断与排除、日志管理、定期备份、垃圾信息清理、技术支持等日常性工作。纠错性维护:修正信息系统可能存在的软件缺陷和错误以及其他未曾预见的错误等。适应性维护:适应硬件环境和系统软件的变化而进行的性能检测调优、系统优化、配置变更等局部性修改。完善性维护:为扩充功能和改善性能而进行的一般性修改。操作性指导:为用户正常开展业务而提供的操作指导或帮助,指导用户按运行要求开展业务,并解答用户提出的各类咨询。技术培训:定期组织行业用户进行与信息系统应用操作与维护相关的技术培训,提升用户操作与维护技能。数据完整性维护及数据分析:应用系统安全性维护(安全保障的设备或系统软件,包括防火墙、入侵防范系统、安全审计系统、防病毒系统、终端安全管理系统等),信息内容服务型维护(包括信息采集、整理、编辑、制作、发布、挖掘、分析和安全管理等)。一般来讲,整个运维工作的核心是应用系统的维护,也是最难的部分,特别是对第三方运维商来说。

3.4.3 计算机硬件设备的运维
计算机硬件设备是指计算机系统中由电子、机械和光电元件等组成的各种物理装置的总称。这些物理装置按系统结构的要求构成一个有机整体为计算机软件运行提供物质基础。简言之,计算机硬件的功能是输入并存储程序和数据,以及执行程序把数据加工成可以利用的形式。从外观上来看,微机由主机箱和外部设备组成。主机箱内主要包括CPU、内存、主板、硬盘驱动器、光盘驱动器、各种扩展卡、连接线、电源等;外部设备包括鼠标、键盘、显示器、音箱等,这些设备通过接口和连接线与主机相连。

计算机硬件设备的运维包括针对PC电脑、平板电脑、服务器、存储设备、网络交换机以及其他计算机控制设备提供定期巡检、定期保养、故障诊断与排除以及备件的更换等运维服务。

3.4.4 机房及环境的运维
计算机机房普遍指的是电信、网通、移动、双线、电力以及政府或者企业等存放服务器、为用户以及员工提供IT服务的地方。

机房环境监测系统是一个综合计算机网络技术、数据库技术、通信技术、自动控制技术、新型传感技术等构成的计算机网络,提供一种以计算机技术为基础、基于集中管理监控模式的自动化、智能化和高效率的技术手段,系统监控对象主要是机房动力和环境设备等设备(如配电、UPS、空调、温湿度、漏水、烟雾、视频、门禁、防雷、消防系统等)。

机房及环境的运维主要针对机房中比较重要的设施(如配电、UPS、空调、温湿度、防水、烟雾、视频、门禁、防雷、消防系统等)进行全天候不间断的监控与预防性维护。

相关文章
|
24天前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
54 2
|
1月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
52 4
|
7天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代IT基础设施中的应用与价值####
本文探讨了智能化运维(AIOps)在现代IT基础设施管理中的实际应用、面临的挑战及其带来的深远影响。通过引入先进的算法和机器学习模型,智能化运维不仅提高了故障检测与响应的速度,还显著优化了资源配置,降低了运营成本,为企业数字化转型提供了强有力的技术支撑。 ####
|
18天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI驱动下的IT运维革命###
本文探讨了人工智能(AI)技术在IT运维领域的创新应用,强调其在提升效率、预防故障及优化资源配置中的关键作用,揭示了智能运维的新趋势。 ###
|
14天前
|
机器学习/深度学习 人工智能 运维
智能化运维:提升IT服务效率的新引擎###
本文深入浅出地探讨了智能化运维(AIOps)如何革新传统IT运维模式,通过大数据、机器学习与自动化技术,实现故障预警、快速定位与处理,从而显著提升IT服务的稳定性和效率。不同于传统运维依赖人工响应,AIOps强调预测性维护与自动化流程,为企业数字化转型提供强有力的支撑。 ###
|
28天前
|
人工智能 运维 监控
智能化运维:AI在IT运维中的挑战与机遇###
本文探讨了人工智能(AI)技术在IT运维领域的应用,重点分析了AI如何提升运维效率、减少故障恢复时间,并预测未来发展趋势。通过具体案例展示了AI在实际运维中的应用效果,同时指出当前面临的挑战和解决方案,为读者提供一个全面了解智能化运维的视角。 ###
|
27天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用探索###
随着信息技术的飞速发展,传统的IT运维模式正面临着前所未有的挑战。本文旨在探讨人工智能(AI)技术如何赋能IT运维,通过智能化手段提升运维效率、降低故障率,并为企业带来更加稳定高效的服务体验。我们将从AI运维的概念入手,深入分析其在故障预测、异常检测、自动化处理等方面的应用实践,以及面临的挑战与未来发展趋势。 ###
|
7天前
|
机器学习/深度学习 运维 监控
智能运维在现代IT架构中的转型之路####
【10月更文挑战第29天】 本文旨在探讨智能运维(AIOps)如何成为现代IT架构不可或缺的一部分,通过分析其核心价值、关键技术及实践案例,揭示AIOps在提升系统稳定性、优化资源配置及加速故障响应中的关键作用。不同于传统运维模式的被动响应,智能运维强调预测性维护与自动化处理,为企业数字化转型提供强有力的技术支撑。 ####
34 0
|
20天前
|
人工智能 运维 监控
运维技术深度解析:构建高效、稳定的IT基础设施
【10月更文挑战第22天】运维技术深度解析:构建高效、稳定的IT基础设施
43 0
|
20天前
|
机器学习/深度学习 边缘计算 运维
运维技术深度解析:构建高效、稳定的IT基础设施
【10月更文挑战第22天】运维技术深度解析:构建高效、稳定的IT基础设施
36 0