《IT运维之道》一17.1 ITIL

简介:

本节书摘来异步社区《IT运维之道》一书中的第17章,第17.1节,作者: 李鹏 责编: 张涛,更多章节内容可以访问云栖社区“异步社区”公众号查看。

17.1 ITIL

ITIL(Information Technology Infrastructure Library,信息技术基础架构库)由英国政府部门CCTA(Central Computing and Telecommunications Agency)在20世纪80年代末制订,现由英国商务部OGC(Office of Government Commerce)负责管理,主要适用于IT服务管理(ITSM)。20世纪90年代后期,ITIL的思想和方法被广泛引用,并进一步发展。

ITIL一开始作为政府IT部门的最佳实践指南,问世后不久便被推广到英国的私营企业,然后传遍欧洲,随后开始在美国兴起。自从1980年至今,ITIL经历了三个主要的版本:

Version 1——1986—1999年原始版,主要是基于职能型的实践,开发了40多卷图书。

Version 2——1999—2006年ITIL v2版,主要是基于流程型的实践,包含7个体系:服务支持、服务提供、实施服务管理规划、应用管理、安全管理、基础架构管理及ITIL的业务前景。它已经成为了IT服务管理领域全球广泛认可的最佳实践框架。

Version 3——2004—2007年基于服务生命周期的ITIL v3整合了v1和v2的精华,并与时俱进地融入了IT服务管理领域当前的最佳实践。

ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。企业的IT部门和最终用户可以根据自己的能力和需求定义自己所要求的不同服务水平,参考ITIL来规划和制定其IT基础架构及服务管理,从而确保IT服务管理能为企业的业务运作提供更好的支持。对企业来说,实施ITIL的最大意义在于把IT与业务紧密地结合起来了,从而让企业的IT投资回报最大化。

目前,ITIL已经在全球IT服务管理领域得到了广泛的认同和支持,四家最领先的IT管理解决方案提供商都宣布了相应的策略:IBM Tivoli推出了“业务影响管理”解决方案,HP公司倡导“IT服务管理”,CA公司强调“管理按需计算环境”,BMC公司则推出了“业务服务管理”理念。实际上,无论各公司的理念和解决方案有多大差异,但目标都是一致的:把IT与业务相结合,以业务为核心搭建和管理IT系统。

2001年英国标准学会(British Standard Institute,BSI)在国际IT服务管理论坛(itSMF)年会上,正式发布了基于ITIL的英国国家标准BS 15000。2002年,BS 15000为国际标准化组织(ISO)所接受,作为IT服务管理的国际标准的重要组成部分。目前,ITSM领域正成为全球IT厂商、政府、企业和业界专家广泛参与的新兴领域,对未来的IT走向和企业信息化,将会产生深远的影响。其内容描述的是IT部门应该包含的各个工作流程以及各个工作流程之间的相互关系。其架构模型如图17.1所示。


1

要强调的一点是:ITIL不是一个正式标准,而是目前普遍实行的“事实”上的标准。

1.ITIL的核心模块
ITIL的核心包括4个职能、26个流程,具体如下。

4个职能:服务台、运营管理、应用管理、技术管理;

18个流程:事件管理、事故管理、请求实施、问题管理、资产与配置管理、变更管理、发布与部署管理、服务级别管理、连续性管理、可用性管理、能力管理、IT服务财务管理、信息安全管理、服务报告、业务关系管理、供应商管理、知识管理、服务目录管理;

8个流程:战略制定、需求管理、服务组合管理、评估、服务验证与测试、转换规划与支持、访问管理。

下面就其中的部分流程加以说明:

服务台:服务台是IT部门和IT服务用户之间的单一联系点。它通过提供一个集中和专职的服务联系点促进了组织业务流程与服务管理基础架构集成。服务台的主要目标是协调客户(用户)和IT部门之间的联系,为IT服务运作提供支持,从而提高客户的满意度。

事故管理:事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。

问题管理:问题管理是指通过调查和分析IT基础架构的薄弱环节、查明事故产生的潜在原因,并制定解决事故的方案和防止事故再次发生的措施,将由于问题和事故对业务产生的负面影响减小到最低的服务管理流程。与事故管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。

配置管理:配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,其目的是提供IT基础架构的逻辑模型,支持其他服务管理流程特别是变更管理和发布管理的运作。

变更管理:变更管理是指为在最短的中断时间内完成基础架构或服务的任一方面的变更而对其进行控制的服务管理流程。变更管理的目标是确保在变更实施过程中使用标准的方法和步骤,尽快地实施变更,以将由变更所导致的业务中断对业务的影响减小到最低。

发布管理:发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发,它由变更管理流程控制。

服务级别管理:服务级别管理是为签订服务级别协议(SLA)而进行的计划、草拟、协商、监控和报告以及签订服务级别协议后对服务绩效的评价等一系列活动所组成的一个服务管理流程。服务级别管理旨在确保组织所需的IT服务质量在成本合理的范围内得以维持并逐渐提高。

IT服务财务管理:IT服务财务管理是负责预算和核算IT服务提供方提供IT服务所需的成本,并向客户收取相应服务费用的管理流程,它包括IT投资预算、IT服务成本核算和服务计费三个子流程,其目标是通过量化服务成本减少成本超支的风险、减少不必要的浪费、合理引导客户的行为,从而最终保证所提供的IT服务符合成本效益的原则。IT服务财务管理流程产生的预算和核算信息可以为服务级别管理、能力管理、IT服务持续性管理和变更管理等管理流程提供决策依据。

IT服务持续性管理:IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务,从而支持组织的业务持续运作的能力。

能力管理:能力管理是指在成本和业务需求的双重约束下,通过配置合理的服务能力使组织的IT资源发挥最大效能的服务管理流程。能力管理流程包括业务能力管理、服务能力管理和资源能力管理三个子流程。

可用性管理:可用性管理是通过分析用户和业务方的可用性需求并据以优化和设计IT基础架构的可用性,从而确保以合理成本满足不断增长的可用性需求的管理流程。可用性管理是一个前瞻性的管理流程,它通过对业务和用户可用性需求的定位,使得IT服务的设计建立在真实需求的基础上,从而避免IT服务运作中采用过度的可用性级别,节约了IT服务的运作成本。

2.实施ITIL的益处
ITIL旨在解决并纠正这些可能出现的弊端,它提供了一个指导性框架,这个框架可以保留组织现有IT管理方法中的合理部分,同时增加必要的技术,并且方便了各种IT职能间的沟通和协调。但它并不是一套理论模式,而是以全球最佳实际经验为依据,基于高质量、合理定义、可重复流程等运作为基础,确立的可持续改进的计划。

对于企业实施ITIL,可以有助于最终进行完善的服务管理。在ITIL的各个流程管理中,可以直接与各个业务部门相互作用,实现对业务功能及流程进行重新设计,降低成本、缩短周转时间、提高质量和增进客户满意度。

ITIL的实施,使信息系统部门能够对发生在财务、销售、市场、制造等业务上的流程改变,做出及时反应。某些情况下,这还导致了一些相关组织机构的诞生,如变更委员会、紧急变更委员,内部的业务经理等,以增进业务与IT的整合。

实施ITIL,可以实现IT对业务支持的精确性和前瞻性。市场竞争的加剧要求企业能够快速做出决策,并缩短反应时间。传统的企业效益度量标准如收入、市场份额等,对业务状况的反映是滞后的,一旦发现问题后,再想规避问题,往往为时已晚。

就IT部门来讲,在投资回报方面,参考ITIL来考虑IT投资,就很容易定义期望的收益,并对收益进行度量。同时,可以明确地建立一支担有共同责任和义务的、多技能的、跨组织的合作团队。由于相互信赖程度的加深,用户与IT人员之间将不再会互相指责,而形成相互促进的形式,改变其“救火队”的形象。

对于企业管理者,ITIL能够帮助:

  • IT从规划到实施到运维更加有效,降低成本的同时获得更高的IT服务体验。
  • 确保IT流程支持业务流程,提高企业整体业务运营的质量。
  • 推进IT部门和业务部门的沟通,也增进IT部门于业务部门的相互融合,变IT部门由成本中心为利润中心。
  • 减少冗余和重复的工作,提高IT客户和业务人员的生产效率。

对于IT部门负责人,ITIL能够帮助:

  • 了解业界领先的IT服务管理模式,熟悉业界领先的IT管理最佳实践。
  • 学会让IT部门为公司创造新的战略竞争力。
  • 让企业内部客户对IT有更合理的期望,更清楚为达到这些期望需要付出什么。
  • 让部门中的IT员工更清楚对他们的期望,有合适的流程和相应培训来确保他们能实现这些期望。
  • 加强个人的IT服务管理工作技能,成为IT界的MBA,向管理型的IT人才发展。

对于IT部门的运维操作人员,ITIL能够帮助:

  • 了解业界领先的IT服务管理模式,熟悉业界领先的IT管理最佳实践。
  • 加强个人的工作技能提高工作表现;获得更多的专业知识,从而胜任更多的工作。
  • 当软件或硬件不再使用时,可以及时取消对其的维护及相应的维护合同。
  • 加强个人的IT服务管理工作技能,成为IT界的MBA从而获得更好的发展机会。
  1. 3.ITIL的实施步骤

ITIL虽然在20世纪90年代就已经成为标准,但国内企业对它的了解才刚刚开始。针对这一状况,Malcolm Fry先生给出了他的建议。

首先要阅读ITIL资料,了解ITIL准则,培养ITIL专家。ITIL不是一种产品,而是一套流程和准则,必须对它有充分的了解,才可能成功实施。国外一些企业已经培养了大批ITIL人才,例如,微软公司有3000多人通过了考试,宝洁公司有1000多人通过,BMC也有400多人通过。国内的情况则不容乐观,有关ITIL的培训认证还没有开展起来,虽然很多企业关注ITIL,但真正实施的并不多。

其次是要建立科学合理的流程。Malcolm Fry认为,在ITIL的实践过程中,流程是最重要的,因为流程是IT管理的基础:在IT管理的过程中,针对同一问题的具体实施步骤可能不同,但流程是不会改变的。让我们来看一个简单的例子:早上上班,你发现你的计算机不能正常工作了,你会怎么办?你可能会做以下事情:检查电缆、请系统管理员来检查机器、报告老板等。故障很快找到,问题得到了解决!如果我们不按流程办事,而是随意而为,那么查找一个小故障就可能用掉一整天的时间。

第三是要选择适当的软件产品。企业对IT系统的管理是通过IT管理软件实现的,因此,选择适当的软件对成功实现ITIL的目标至关重要。目前,一些主流厂商的软件产品都符合ITIL的要求,包括IBM Tivoli、CA Unicenter、HP OpenView、BMC Patrol等。

相关文章
|
3月前
|
机器学习/深度学习 人工智能 运维
企业内训|LLM大模型在服务器和IT网络运维中的应用-某日企IT运维部门
本课程是为某在华日资企业集团的IT运维部门专门定制开发的企业培训课程,本课程旨在深入探讨大型语言模型(LLM)在服务器及IT网络运维中的应用,结合当前技术趋势与行业需求,帮助学员掌握LLM如何为运维工作赋能。通过系统的理论讲解与实践操作,学员将了解LLM的基本知识、模型架构及其在实际运维场景中的应用,如日志分析、故障诊断、网络安全与性能优化等。
104 2
|
1月前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
209 4
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
53 4
|
1月前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
65 4
|
2月前
|
运维 监控 安全
自动化运维的利剑:Ansible在现代IT架构中的应用
在数字化浪潮中,企业对IT系统的敏捷性和可靠性要求日益提高。Ansible,一种简单但强大的自动化运维工具,正成为现代IT架构中不可或缺的一部分。它通过声明式编程语言YAM,简化了系统配置、应用部署和任务自动化的过程,显著提升了运维效率和准确性。本文将深入探讨Ansible的核心特性、应用场景以及如何有效整合进现有IT环境,为读者揭示其在自动化运维中的实用价值和未来发展潜力。
|
2月前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索####
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。 ####
|
2月前
|
数据采集 机器学习/深度学习 运维
智能运维在IT服务管理中的实践与挑战####
本文深入探讨了智能运维(AIOps)在现代IT服务管理中的应用,通过分析其如何提升效率、预测故障并优化资源分配,阐述了智能运维的实施策略与面临的主要挑战。不同于传统摘要,本部分旨在直接概述文章的核心观点与结论,为读者提供快速了解全文主旨的窗口。
|
2月前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT运维中的应用与挑战###
本文探讨了人工智能(AI)技术在IT运维领域的应用现状、具体实现方式及其面临的挑战。通过分析AI如何优化故障预测、自动化处理和资源管理,文章旨在揭示AI赋能下运维工作的变革潜力与实践难题,为读者提供对智能化运维趋势的深刻理解。 ###
|
2月前
|
运维 Devops 应用服务中间件
自动化运维的利剑:Ansible在现代IT架构中的应用
【10月更文挑战第42天】本文旨在揭示自动化运维工具Ansible如何革新现代IT架构,通过简化配置管理和部署流程,提升效率和可靠性。我们将探索Ansible的核心功能、语言特性以及其在DevOps文化中的角色。文章还将展示如何借助Ansible构建模块化和可重用的配置代码,实现快速迭代与部署,并确保系统一致性。通过阅读本文,运维人员将了解如何利用Ansible优化日常任务,加速产品上线速度,同时提高系统的稳健性。
49 5

热门文章

最新文章