《IT运维之道》——3.4 落实整体运维

简介:

本节书摘来自异步社区《IT运维之道》一书中的第3章,第3.4节,作者: 李鹏 更多章节内容可以访问云栖社区“异步社区”公众号查看。

3.4 落实整体运维

IT运维的第一件要事是按照IT运维服务的原则做事,第二件要事是将这些原则应用到IT运维服务工作当中,第三件要事是将运维落实到整个技术系统的每个环节中。为了方便读者理解,我们将常见的系统抽象为四个子系统来一一介绍,它们分别是软件支撑系统、应用系统、计算机硬件设备和机房及环境。

3.4.1 软件支撑系统运维
软件支撑系统是指为应用软件运行条件的软件环境包括操作系统、编译程序 、数据库管理系统 、中间件、各种高级语言等。如:针对信息系统服务器上部署的操作系统(如Windows、AIX、LINUX、HP)、数据库(如DB2、Oracle、SQL Server)、中间件(如WebSphere)、数据传输软件(如MQ)等,主要运维工作是提供日常例行检查、故障排除、系统软件升级、定期巡检、数据库性能调优、系统与中间件部署、系统软件维护培训等运维服务。

3.4.2 应用系统的运维
应用系统是指为特定用途所开发并可在生产环境执行的一个或多个应用程序,以及和程序一起产生的数据信息。

应用系统运维主要包括日常性维护、纠错性维护、适应性维护、完善性维护、操作性指导和技术培训、数据完整性维护及数据分析等。日常性维护:信息系统软件运行状态监控、日常检查、故障诊断与排除、日志管理、定期备份、垃圾信息清理、技术支持等日常性工作。纠错性维护:修正信息系统可能存在的软件缺陷和错误以及其他未曾预见的错误等。适应性维护:适应硬件环境和系统软件的变化而进行的性能检测调优、系统优化、配置变更等局部性修改。完善性维护:为扩充功能和改善性能而进行的一般性修改。操作性指导:为用户正常开展业务而提供的操作指导或帮助,指导用户按运行要求开展业务,并解答用户提出的各类咨询。技术培训:定期组织行业用户进行与信息系统应用操作与维护相关的技术培训,提升用户操作与维护技能。数据完整性维护及数据分析:应用系统安全性维护(安全保障的设备或系统软件,包括防火墙、入侵防范系统、安全审计系统、防病毒系统、终端安全管理系统等),信息内容服务型维护(包括信息采集、整理、编辑、制作、发布、挖掘、分析和安全管理等)。一般来讲,整个运维工作的核心是应用系统的维护,也是最难的部分,特别是对第三方运维商来说。

3.4.3 计算机硬件设备的运维
计算机硬件设备是指计算机系统中由电子、机械和光电元件等组成的各种物理装置的总称。这些物理装置按系统结构的要求构成一个有机整体为计算机软件运行提供物质基础。简言之,计算机硬件的功能是输入并存储程序和数据,以及执行程序把数据加工成可以利用的形式。从外观上来看,微机由主机箱和外部设备组成。主机箱内主要包括CPU、内存、主板、硬盘驱动器、光盘驱动器、各种扩展卡、连接线、电源等;外部设备包括鼠标、键盘、显示器、音箱等,这些设备通过接口和连接线与主机相连。

计算机硬件设备的运维包括针对PC电脑、平板电脑、服务器、存储设备、网络交换机以及其他计算机控制设备提供定期巡检、定期保养、故障诊断与排除以及备件的更换等运维服务。

3.4.4 机房及环境的运维
计算机机房普遍指的是电信、网通、移动、双线、电力以及政府或者企业等存放服务器、为用户以及员工提供IT服务的地方。

机房环境监测系统是一个综合计算机网络技术、数据库技术、通信技术、自动控制技术、新型传感技术等构成的计算机网络,提供一种以计算机技术为基础、基于集中管理监控模式的自动化、智能化和高效率的技术手段,系统监控对象主要是机房动力和环境设备等设备(如配电、UPS、空调、温湿度、漏水、烟雾、视频、门禁、防雷、消防系统等)。

机房及环境的运维主要针对机房中比较重要的设施(如配电、UPS、空调、温湿度、防水、烟雾、视频、门禁、防雷、消防系统等)进行全天候不间断的监控与预防性维护。

相关文章
|
23天前
|
人工智能 运维 监控
智能化运维:AI在IT管理中的角色与挑战
随着科技的不断进步,人工智能(AI)已经渗透到我们生活的方方面面,其中包括IT运维领域。本文将探讨AI如何改变传统运维模式,提高效率和准确性,并分析在实施智能化运维时可能遇到的挑战。
|
24天前
|
机器学习/深度学习 人工智能 运维
智能化运维:未来IT管理的新篇章
在数字化时代的浪潮中,智能化运维(AIOps)正成为IT管理领域的革命性力量。通过整合大数据、机器学习和自动化技术,AIOps不仅提升了运维效率,还在预测性维护、异常检测等方面展现出巨大潜力。本文将探讨AIOps的核心概念、实施策略以及面临的挑战与机遇,为读者揭示这一创新实践如何重塑IT运维的未来。
32 2
|
24天前
|
运维 Prometheus 监控
自动化运维:打造高效IT基础设施的秘诀
【9月更文挑战第11天】在信息技术日新月异的今天,高效的IT基础设施是企业竞争力的关键。本文将探讨如何通过自动化运维来提升效率,减少人为错误,并保持系统的稳定性和安全性。我们将从基础概念入手,逐步深入到具体的工具和策略,最终实现运维工作的自动化。无论你是运维新手还是资深专家,这篇文章都将为你提供宝贵的见解和实用的技巧。
|
27天前
|
机器学习/深度学习 运维 监控
智能运维:未来IT管理的革新之路
在数字化浪潮汹涌的今天,智能运维成为企业提升竞争力的关键。本文将深入浅出地探索智能运维的核心概念、技术应用以及它如何重塑IT管理的未来。通过具体案例,我们将一窥智能运维如何实现故障预测、自动化处理和持续优化,最终引领企业走向高效、稳定、创新的未来。
37 2
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:未来IT管理的革命之路
在数字化浪潮的推动下,企业对IT系统的稳定性和效率要求日益增高。传统的运维模式已难以满足现代业务的需求,智能化运维应运而生。本文将探讨智能化运维的概念、优势以及实施策略,旨在为企业提供一条提升IT管理效能的清晰路径。
62 3
|
1月前
|
运维 负载均衡 监控
运维之光:打造高效、稳定的IT环境
在数字化浪潮中,企业对IT系统的依赖日益加深。本文将深入探讨如何通过高效的运维管理,构建一个稳定可靠的IT环境,确保业务连续性和数据安全。我们将从基础架构的优化、自动化工具的应用、团队协作与沟通的重要性,到持续学习与创新的必要性等方面进行详细阐述。无论你是初入运维领域的新手,还是希望提升现有系统性能的资深专家,这篇文章都将为你提供宝贵的见解和实用的策略。
47 1
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI技术在IT管理中的创新应用
本文将探讨如何运用人工智能技术优化IT运维流程,提升效率并减少人为错误。我们将从智能监控、自动化响应到预测性维护等方面,分析AI在现代IT运维中的角色和价值。文章旨在为读者提供一种全新的视角,理解AI技术如何成为IT部门的强大盟友,并指出实施这些技术时可能遇到的挑战及应对策略。
|
2月前
|
机器学习/深度学习 缓存 运维
智能化运维:机器学习在IT管理中的革命性应用
【8月更文挑战第28天】 随着技术的飞速发展,传统的IT运维方式已不能满足现代企业的需求。智能化运维,通过整合机器学习技术,正在重塑我们对IT基础设施的管理方法。本文将探讨智能化运维的概念、实施步骤及其带来的变革,同时分享一些成功案例,以期为读者提供一种全新的视角和思考路径。
49 6
|
22天前
|
运维 监控 数据可视化
高效运维的秘密武器:自动化工具链的构建与实践在当今数字化时代,IT系统的复杂性和规模不断增加,使得传统的手动运维方式难以应对日益增长的业务需求。因此,构建一套高效的自动化工具链成为现代运维的重要任务。本文将深入探讨如何通过自动化工具链提升IT运维效率,确保系统稳定运行,并实现快速响应和故障恢复。
随着企业IT架构的不断扩展和复杂化,传统的手动运维已无法满足业务需求。自动化工具链的构建成为解决这一问题的关键。本文介绍了自动化工具链的核心概念、常用工具及其选择依据,并通过实际案例展示了自动化工具链在提升运维效率、减少人为错误、优化资源配置等方面的显著效果。从监控系统到自动化运维平台,再到持续集成/持续部署(CI/CD)的流程,我们将一步步揭示如何成功实施自动化工具链,助力企业实现高效、稳定、可靠的IT运维管理。
|
2月前
|
运维 应用服务中间件 网络安全
自动化运维的新篇章:Ansible在现代IT架构中的应用与实践
【8月更文挑战第30天】随着信息技术的飞速发展,企业对运维效率和可靠性的要求日益增高。传统的手动运维方式已难以应对复杂多变的IT环境,自动化运维因此成为行业新宠。本文将深入探讨Ansible这一流行的自动化工具,如何通过其简洁的配置管理和强大的多节点部署能力,助力现代IT架构实现高效、可靠的运维管理。我们将从Ansible的核心概念入手,逐步解析其在配置管理、任务执行、应用部署等方面的实战应用,并结合代码示例,展示如何利用Ansible简化日常运维工作,提升运维质量和效率。无论你是运维新手还是资深专家,这篇文章都将为你提供宝贵的洞见和实操技巧。

热门文章

最新文章

下一篇
无影云桌面