《IT运维之道》——第17章 天外有天:IT服务的国际标准17.1 ITIL

简介:

本节书摘来自异步社区《IT运维之道》一书中的第17章,第17.1节,作者: 李鹏 更多章节内容可以访问云栖社区“异步社区”公众号查看。

第17章 天外有天:IT服务的国际标准

17.1 ITIL

ITIL(Information Technology Infrastructure Library,信息技术基础架构库)由英国政府部门CCTA(Central Computing and Telecommunications Agency)在20世纪80年代末制订,现由英国商务部OGC(Office of Government Commerce)负责管理,主要适用于IT服务管理(ITSM)。20世纪90年代后期,ITIL的思想和方法被广泛引用,并进一步发展。

ITIL一开始作为政府IT部门的最佳实践指南,问世后不久便被推广到英国的私营企业,然后传遍欧洲,随后开始在美国兴起。自从1980年至今,ITIL经历了三个主要的版本:

Version 1——1986—1999年原始版,主要是基于职能型的实践,开发了40多卷图书。

Version 2——1999—2006年ITIL v2版,主要是基于流程型的实践,包含7个体系:服务支持、服务提供、实施服务管理规划、应用管理、安全管理、基础架构管理及ITIL的业务前景。它已经成为了IT服务管理领域全球广泛认可的最佳实践框架。

Version 3——2004—2007年基于服务生命周期的ITIL v3整合了v1和v2的精华,并与时俱进地融入了IT服务管理领域当前的最佳实践。

ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。企业的IT部门和最终用户可以根据自己的能力和需求定义自己所要求的不同服务水平,参考ITIL来规划和制定其IT基础架构及服务管理,从而确保IT服务管理能为企业的业务运作提供更好的支持。对企业来说,实施ITIL的最大意义在于把IT与业务紧密地结合起来了,从而让企业的IT投资回报最大化。

目前,ITIL已经在全球IT服务管理领域得到了广泛的认同和支持,四家最领先的IT管理解决方案提供商都宣布了相应的策略:IBM Tivoli推出了“业务影响管理”解决方案,HP公司倡导“IT服务管理”,CA公司强调“管理按需计算环境”,BMC公司则推出了“业务服务管理”理念。实际上,无论各公司的理念和解决方案有多大差异,但目标都是一致的:把IT与业务相结合,以业务为核心搭建和管理IT系统。

2001年英国标准学会(British Standard Institute,BSI)在国际IT服务管理论坛(itSMF)年会上,正式发布了基于ITIL的英国国家标准BS 15000。2002年,BS 15000为国际标准化组织(ISO)所接受,作为IT服务管理的国际标准的重要组成部分。目前,ITSM领域正成为全球IT厂商、政府、企业和业界专家广泛参与的新兴领域,对未来的IT走向和企业信息化,将会产生深远的影响。其内容描述的是IT部门应该包含的各个工作流程以及各个工作流程之间的相互关系。其架构模型如图17.1所示。


<a href=https://yqfile.alicdn.com/8e598ad763baeb96747396d0783b0413425b0327.png" >

要强调的一点是:ITIL不是一个正式标准,而是目前普遍实行的“事实”上的标准。

1.ITIL的核心模块
ITIL的核心包括4个职能、26个流程,具体如下。

4个职能:服务台、运营管理、应用管理、技术管理;

18个流程:事件管理、事故管理、请求实施、问题管理、资产与配置管理、变更管理、发布与部署管理、服务级别管理、连续性管理、可用性管理、能力管理、IT服务财务管理、信息安全管理、服务报告、业务关系管理、供应商管理、知识管理、服务目录管理;

8个流程:战略制定、需求管理、服务组合管理、评估、服务验证与测试、转换规划与支持、访问管理。

下面就其中的部分流程加以说明:

  • 服务台:服务台是IT部门和IT服务用户之间的单一联系点。它通过提供一个集中和专职的服务联系点促进了组织业务流程与服务管理基础架构集成。服务台的主要目标是协调客户(用户)和IT部门之间的联系,为IT服务运作提供支持,从而提高客户的满意度。
  • 事故管理:事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。
  • 问题管理:问题管理是指通过调查和分析IT基础架构的薄弱环节、查明事故产生的潜在原因,并制定解决事故的方案和防止事故再次发生的措施,将由于问题和事故对业务产生的负面影响减小到最低的服务管理流程。与事故管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。
  • 配置管理:配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,其目的是提供IT基础架构的逻辑模型,支持其他服务管理流程特别是变更管理和发布管理的运作。
  • 变更管理:变更管理是指为在最短的中断时间内完成基础架构或服务的任一方面的变更而对其进行控制的服务管理流程。变更管理的目标是确保在变更实施过程中使用标准的方法和步骤,尽快地实施变更,以将由变更所导致的业务中断对业务的影响减小到最低。
  • 发布管理:发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发,它由变更管理流程控制。
  • 服务级别管理:服务级别管理是为签订服务级别协议(SLA)而进行的计划、草拟、协商、监控和报告以及签订服务级别协议后对服务绩效的评价等一系列活动所组成的一个服务管理流程。服务级别管理旨在确保组织所需的IT服务质量在成本合理的范围内得以维持并逐渐提高。
  • IT服务财务管理:IT服务财务管理是负责预算和核算IT服务提供方提供IT服务所需的成本,并向客户收取相应服务费用的管理流程,它包括IT投资预算、IT服务成本核算和服务计费三个子流程,其目标是通过量化服务成本减少成本超支的风险、减少不必要的浪费、合理引导客户的行为,从而最终保证所提供的IT服务符合成本效益的原则。IT服务财务管理流程产生的预算和核算信息可以为服务级别管理、能力管理、IT服务持续性管理和变更管理等管理流程提供决策依据。
  • IT服务持续性管理:IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务,从而支持组织的业务持续运作的能力。
  • 能力管理:能力管理是指在成本和业务需求的双重约束下,通过配置合理的服务能力使组织的IT资源发挥最大效能的服务管理流程。能力管理流程包括业务能力管理、服务能力管理和资源能力管理三个子流程。
  • 可用性管理:可用性管理是通过分析用户和业务方的可用性需求并据以优化和设计IT基础架构的可用性,从而确保以合理成本满足不断增长的可用性需求的管理流程。可用性管理是一个前瞻性的管理流程,它通过对业务和用户可用性需求的定位,使得IT服务的设计建立在真实需求的基础上,从而避免IT服务运作中采用过度的可用性级别,节约了IT服务的运作成本。

2.实施ITIL的益处
ITIL旨在解决并纠正这些可能出现的弊端,它提供了一个指导性框架,这个框架可以保留组织现有IT管理方法中的合理部分,同时增加必要的技术,并且方便了各种IT职能间的沟通和协调。但它并不是一套理论模式,而是以全球最佳实际经验为依据,基于高质量、合理定义、可重复流程等运作为基础,确立的可持续改进的计划。

对于企业实施ITIL,可以有助于最终进行完善的服务管理。在ITIL的各个流程管理中,可以直接与各个业务部门相互作用,实现对业务功能及流程进行重新设计,降低成本、缩短周转时间、提高质量和增进客户满意度。

ITIL的实施,使信息系统部门能够对发生在财务、销售、市场、制造等业务上的流程改变,做出及时反应。某些情况下,这还导致了一些相关组织机构的诞生,如变更委员会、紧急变更委员,内部的业务经理等,以增进业务与IT的整合。

实施ITIL,可以实现IT对业务支持的精确性和前瞻性。市场竞争的加剧要求企业能够快速做出决策,并缩短反应时间。传统的企业效益度量标准如收入、市场份额等,对业务状况的反映是滞后的,一旦发现问题后,再想规避问题,往往为时已晚。

就IT部门来讲,在投资回报方面,参考ITIL来考虑IT投资,就很容易定义期望的收益,并对收益进行度量。同时,可以明确地建立一支担有共同责任和义务的、多技能的、跨组织的合作团队。由于相互信赖程度的加深,用户与IT人员之间将不再会互相指责,而形成相互促进的形式,改变其“救火队”的形象。

对于企业管理者,ITIL能够帮助:

  • IT从规划到实施到运维更加有效,降低成本的同时获得更高的IT服务体验。
  • 确保IT流程支持业务流程,提高企业整体业务运营的质量。
  • 推进IT部门和业务部门的沟通,也增进IT部门于业务部门的相互融合,变IT部门由成本中心为利润中心。
  • 减少冗余和重复的工作,提高IT客户和业务人员的生产效率。

对于IT部门负责人,ITIL能够帮助:

  • 了解业界领先的IT服务管理模式,熟悉业界领先的IT管理最佳实践。
    学会让IT部门为公司创造新的战略竞争力。
  • 让企业内部客户对IT有更合理的期望,更清楚为达到这些期望需要付出什么。
  • 让部门中的IT员工更清楚对他们的期望,有合适的流程和相应培训来确保他们能实现这些期望。
  • 加强个人的IT服务管理工作技能,成为IT界的MBA,向管理型的IT人才发展。

对于IT部门的运维操作人员,ITIL能够帮助:

  • 了解业界领先的IT服务管理模式,熟悉业界领先的IT管理最佳实践。
  • 加强个人的工作技能提高工作表现;获得更多的专业知识,从而胜任更多的工作。
  • 当软件或硬件不再使用时,可以及时取消对其的维护及相应的维护合同。
  • 加强个人的IT服务管理工作技能,成为IT界的MBA从而获得更好的发展机会。

3.ITIL的实施步骤
ITIL虽然在20世纪90年代就已经成为标准,但国内企业对它的了解才刚刚开始。针对这一状况,Malcolm Fry先生给出了他的建议。

首先要阅读ITIL资料,了解ITIL准则,培养ITIL专家。ITIL不是一种产品,而是一套流程和准则,必须对它有充分的了解,才可能成功实施。国外一些企业已经培养了大批ITIL人才,例如,微软公司有3000多人通过了考试,宝洁公司有1000多人通过,BMC也有400多人通过。国内的情况则不容乐观,有关ITIL的培训认证还没有开展起来,虽然很多企业关注ITIL,但真正实施的并不多。

其次是要建立科学合理的流程。Malcolm Fry认为,在ITIL的实践过程中,流程是最重要的,因为流程是IT管理的基础:在IT管理的过程中,针对同一问题的具体实施步骤可能不同,但流程是不会改变的。让我们来看一个简单的例子:早上上班,你发现你的计算机不能正常工作了,你会怎么办?你可能会做以下事情:检查电缆、请系统管理员来检查机器、报告老板等。故障很快找到,问题得到了解决!如果我们不按流程办事,而是随意而为,那么查找一个小故障就可能用掉一整天的时间。

第三是要选择适当的软件产品。企业对IT系统的管理是通过IT管理软件实现的,因此,选择适当的软件对成功实现ITIL的目标至关重要。目前,一些主流厂商的软件产品都符合ITIL的要求,包括IBM Tivoli、CA Unicenter、HP OpenView、BMC Patrol等。

相关文章
|
18天前
|
消息中间件 运维 Kafka
运维排查 | Systemd 之服务停止后状态为 failed
运维排查 | Systemd 之服务停止后状态为 failed
|
8月前
|
运维 监控 应用服务中间件
【运维知识进阶篇】zabbix5.0稳定版详解3(监控Nginx+PHP服务状态信息)(二)
【运维知识进阶篇】zabbix5.0稳定版详解3(监控Nginx+PHP服务状态信息)(二)
147 0
|
1月前
|
运维 应用服务中间件 调度
|
6月前
|
运维 Serverless 数据安全/隐私保护
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(1)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(1)
363 0
|
6月前
|
运维 Serverless API
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(2)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(2)
328 0
|
6月前
|
运维 Serverless API
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(3)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(3)
344 0
|
6月前
|
运维 Serverless API
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(4)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(4)
304 0
|
6月前
|
运维 Serverless
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(5)(附结语)
带你读《浅谈阿里云通用产品线Serverless的小小演化史》三、开箱即用的免运维 ---全托管服务能力(5)(附结语)
196 0
|
6月前
|
运维 安全 数据库
渗透攻击实例-系统/服务运维配置不当
渗透攻击实例-系统/服务运维配置不当
|
7月前
|
运维 关系型数据库 MySQL
开源数据库Mysql_DBA运维实战 (部署服务篇)
开源数据库Mysql_DBA运维实战 (部署服务篇)