如何推进IT运维数据中心问题管理

简介: 在数据中心的管理中,问题管理通常因为没有事件管理、变更管理那么直接影响服务的可用性而被忽视,使得遗留下来的问题没有被及时解决,也会导致事件的重复发生,从而降低系统和服务的整体可用性

12.jpg

数据中心问题的定级。根据问题引发事件的程度,将问题定级为高风险问题和普通级问题;高风险问题是指问题不被解决,再度引发事件的可能性很大;普通级问题指问题不被解决,暂时不会引发事件。

  数据中心问题的定级。根据问题引发事件的程度,将问题定级为高风险问题和普通级问题;高风险问题是指问题不被解决,再度引发事件的可能性很大;普通级问题指问题不被解决,暂时不会引发事件。读者可以根据自己的情况进行问题定级的划分,在实际问题定级中,没有统一的强制标准,而是由具体的业务和管理要求决定。

  (1)数据中心问题的定级。根据问题引发事件的程度,将问题定级为高风险问题和普通级问题;高风险问题是指问题不被解决,再度引发事件的可能性很大;普通级问题指问题不被解决,暂时不会引发事件。读者可以根据自己的情况进行问题定级的划分,在实际问题定级中,没有统一的强制标准,而是由具体的业务和管理要求决定。

  (2)数据中心问题的分类。数据中心问题分类有多种方式,可以按照问题所处的区域和类别来进行分类。

1)从业务角度分类。与事件分类相似,可参考数据中心事件分类。

2)从管理或治理角度分类。可以根据不同企业的管理目标来分,如流程问题、工具问题人员问题、供应商的问题及技术架构问题。

3)管理角度还可以再细分。如人员问题中可以细分为人员执行力问题、人员技能问题、人员责任心问题及职责不清问题等。

  问题的分类不是固定的,而是在问题的生命周期内可能发生变化的,问题管理的核心就是将问题多维度、多视角深度剖析,找出管理上、架构上的“短板”,从根本上去解决,这样才可以使得问题管理真正在IT管理或数据中心管理中发挥作用。在数据中心的管理中,问题管理通常因为没有事件管理、变更管理那么直接影响服务的可用性而被忽视,使得遗留下来的问题没有被及时解决,也会导致事件的重复发生,从而降低系统和服务的整体可用性。

  为了更有效推进问题管理,建议:第一,形式很重要,可以将问题按照月度或者季度来跟踪和回顾,而不是作为每天的流程性工作;第二,问题经理人的选择非常重要,通常问题经理是具有丰富经验和行政级别的经理,才能调度资源和有迫切感来解决问题。如果是流程经理兼职问题经理,问题管理推行的难度和阻力将会很大。

相关文章
|
2月前
|
存储 运维 安全
AIGC时代数据中心运维面临的挑战
AIGC时代数据中心运维面临的挑战
69 1
AIGC时代数据中心运维面临的挑战
|
7月前
|
运维 监控 关系型数据库
OBCP第八章-运维、监控与异常处理-用户权限管理
OBCP第八章-运维、监控与异常处理-用户权限管理
59 1
OBCP第八章-运维、监控与异常处理-用户权限管理
|
3月前
|
弹性计算 运维 监控
基于钉钉的阿里云管理实践(三)之运维管控
随着移动互联网的发展,使用移动设备进行云资源管理变得越来越普及。钉钉作为一款企业沟通和协作工具,其集成的阿里云控制台小程序让用户能够在移动端进行便捷的云资源管理操作。本教程将为您介绍如何在钉钉的阿里云控制台小程序内访问并操作阿里云资源。
114 1
|
25天前
|
Kubernetes 安全 Java
运维人少,如何批量管理上百个微服务、上千条流水线?
云效 AppStack 平台针对微服务和云原生环境下的应用管理难题,提供了以应用为中心的资源、流水线和权限管理解决方案。
|
27天前
|
人工智能 运维 监控
未来数据中心的自动化运维技术探索
随着信息技术的快速发展,未来数据中心的运维需求将变得更加复杂而多样化。本文将探讨自动化运维技术在未来数据中心中的应用,分析其优势和挑战,并探讨如何实现高效的自动化运维管理。
|
1月前
|
SQL 分布式计算 运维
Hudi的管理与运维
Hudi的管理与运维
32 0
|
1月前
|
机器学习/深度学习 存储 大数据
利用机器学习优化数据中心的能效管理
【2月更文挑战第17天】 在数据中心的运营过程中,能效管理是维持可持续性和成本效益的关键。本文探讨了一种基于机器学习的方法来优化数据中心的能源使用效率。通过分析历史能耗数据和实时工作负载信息,构建了一个预测模型来指导冷却系统的动态调整,以减少不必要的能源消耗。实验结果表明,该方法能够有效降低能耗,同时保证数据中心的性能和可靠性。
22 2
|
2月前
|
存储 机器学习/深度学习 人工智能
AIGC时代数据中心运维的变革趋势
AIGC时代数据中心运维的变革趋势
56 1
AIGC时代数据中心运维的变革趋势
|
4月前
|
存储 弹性计算 运维
阿里云——云服务器基础运维与管理
阿里云——云服务器基础运维与管理
223 0
|
4月前
|
运维 安全 程序员
纵横“光明顶”,全靠这份全网独一份《数据中心设施运维指南》
数据中心设施运维,经常被与数据中心IT系统运维混为一谈。实际上,两者的工作虽然都以保证IT系统的可用性为最终目标,但在工作对象上,却是截然不同的。IT运维本质上是和比特(bit) 打交道,设施运维则主要和瓦特(Watt)打交道。

热门文章

最新文章