概述
随着业务的不断扩展和信息化建设的持续深入,IT信息系统越来越复杂,业务对信息系统及网络系统的依赖程度也越来越紧密,对IT信息系统运行的稳定性、可靠性要求越来越高。IT系统的安全平稳运行不仅关系到用户的日常工作,而且联系着社会上的多个行业、部门及个人,为此用户IT系统运维的质量和效率、IT信息资源的安全性、稳定性显得更加重要和突出。而与之相对应的是IT运维管理工作多年来一直处于手工处理维护的状况,各种服务工作始终处于一种被动的状态之中。特别是近年来,随着各类应用系统的推广规模、建设速度迅猛发展,科技人员的数量、维护能力和知识水平日显不足,在实际工作中只能采取头痛医头的维护方式,只能等到设备及应用系统出现问题造成故障时,才能进行维护。因此,如何更有效地利用现有的资源,建立高效、规范的一体化运行维护体系,提高IT运行维护服务水平,确保运行在IT系统的业务应用系统稳定安全运行,是目前绝大多数用户信息部门面临的普遍问题和考验。
面临的挑战
在面对着复杂多样的 IT 网络和业务支撑系统,信息部门面临着诸多挑战:
- 如何最大程度的提前发现和改善 IT系统中的不稳定因素?
- 如何满足信息部门复杂的IT 资源不同层面的监控和管理需求?
-如何从业务应用角度提高质量,保证业务使用部门的满足度?
-如何实现 IT运行情况的统一管理分析,为 IT 系统建设提供量化的决策依据?
-如何对业务应用系统的维护工作进行量化考核,从而提升管理绩效?
- ......
等等诸如此类。
因此,依托先进的IT管理思想和技术,建立一套自上而下的、主动的、长效的IT运维管理体制,成为解决问题的关键。
IT运维管理平台是对计算机系统进行综合的集中管理,既面向资源又面向应用,同时还面向各种管理维护人员。
这个平台应该包括以下的管理需求:
- 基于统一、集中的管理体系,统一的数据处理和展现,统一的告警平台。统一的数据处理和展现,消除各个监控工具之间各自为政、系统管理员在各个界面间频繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并通过统一的展现界面进行展现。统一的告警平台,将所有告警纳入监控管理监控平台,并通过短信、邮件和桌面客户端统一告警。
随着业务的不断扩展和信息化建设的持续深入,IT信息系统越来越复杂,业务对信息系统及网络系统的依赖程度也越来越紧密,对IT信息系统运行的稳定性、可靠性要求越来越高。IT系统的安全平稳运行不仅关系到用户的日常工作,而且联系着社会上的多个行业、部门及个人,为此用户IT系统运维的质量和效率、IT信息资源的安全性、稳定性显得更加重要和突出。而与之相对应的是IT运维管理工作多年来一直处于手工处理维护的状况,各种服务工作始终处于一种被动的状态之中。特别是近年来,随着各类应用系统的推广规模、建设速度迅猛发展,科技人员的数量、维护能力和知识水平日显不足,在实际工作中只能采取头痛医头的维护方式,只能等到设备及应用系统出现问题造成故障时,才能进行维护。因此,如何更有效地利用现有的资源,建立高效、规范的一体化运行维护体系,提高IT运行维护服务水平,确保运行在IT系统的业务应用系统稳定安全运行,是目前绝大多数用户信息部门面临的普遍问题和考验。
面临的挑战
在面对着复杂多样的 IT 网络和业务支撑系统,信息部门面临着诸多挑战:
- 如何最大程度的提前发现和改善 IT系统中的不稳定因素?
- 如何满足信息部门复杂的IT 资源不同层面的监控和管理需求?
-如何从业务应用角度提高质量,保证业务使用部门的满足度?
-如何实现 IT运行情况的统一管理分析,为 IT 系统建设提供量化的决策依据?
-如何对业务应用系统的维护工作进行量化考核,从而提升管理绩效?
- ......
等等诸如此类。
因此,依托先进的IT管理思想和技术,建立一套自上而下的、主动的、长效的IT运维管理体制,成为解决问题的关键。
IT运维管理平台是对计算机系统进行综合的集中管理,既面向资源又面向应用,同时还面向各种管理维护人员。
这个平台应该包括以下的管理需求:
- 基于统一、集中的管理体系,统一的数据处理和展现,统一的告警平台。统一的数据处理和展现,消除各个监控工具之间各自为政、系统管理员在各个界面间频繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并通过统一的展现界面进行展现。统一的告警平台,将所有告警纳入监控管理监控平台,并通过短信、邮件和桌面客户端统一告警。
- 以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。
- 采用的技术成熟、先进,并具有较强的集成性和可扩充性的管理平台。
- 易于使用和维护。统一的中文界面,浏览器管理方式,可以多人同时通过浏览器进行访问和操作。
- 解放人力,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并同时提高维护效率。
- 实现对各种服务器(Linux、AIX、Windows2003等)监控管理、各种数据库(Oracle、Sqlserver等)监控管理。要求不仅能够在状态改变或性能指标超越门限时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表。
- 应用的监控管理。比如IIS、Tomcat、Weblogic监控,重点保证服务的可用性和性能。
- 实现对某种业务的服务水平管理。通过业务服务管理,可以某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。
- 实现IT资源管理和业务系统的关联,可以从业务的视角进行IT管理。当某台主机或者应用发生问题、产生告警时,系统管理员可以在第一时间发现该设备影响了哪个应用的正常运行。
- 采用的技术成熟、先进,并具有较强的集成性和可扩充性的管理平台。
- 易于使用和维护。统一的中文界面,浏览器管理方式,可以多人同时通过浏览器进行访问和操作。
- 解放人力,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并同时提高维护效率。
- 实现对各种服务器(Linux、AIX、Windows2003等)监控管理、各种数据库(Oracle、Sqlserver等)监控管理。要求不仅能够在状态改变或性能指标超越门限时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表。
- 应用的监控管理。比如IIS、Tomcat、Weblogic监控,重点保证服务的可用性和性能。
- 实现对某种业务的服务水平管理。通过业务服务管理,可以某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。
- 实现IT资源管理和业务系统的关联,可以从业务的视角进行IT管理。当某台主机或者应用发生问题、产生告警时,系统管理员可以在第一时间发现该设备影响了哪个应用的正常运行。
- 统一的报告和报表,多台设备性能比较,其它格式导出,柱图、XY坐标、饼图、折线图,定期的运维报告等等。
用户通过IT运维管理平台可以实现对IT基础架构的监控,即对主机系统、网络系统、数据库、中间件、业务应用系统、IT环境系统的集中监控和管理;能够及时采集各类告警数据、性能数据和配置数据,进行集成统一的分析、查询、报告和展示,帮助运维管理人员方便有效的定位应用系统问题,直观快速的诊断和分析问题,将运维模式由被动的支持转为主动式服务,从而保障用户整个业务应用系统的正常运行,提高IT运行维护服务水平,全面提升信息部门的管理绩效。
本文转自赖永锋51CTO博客,原文链接:http://blog.51cto.com/mochasoft/307252
,如需转载请自行联系原作者