当前数据中心运维管理工作中存在的问题-阿里云开发者社区

开发者社区> 沉默术士> 正文

当前数据中心运维管理工作中存在的问题

简介:
+关注继续查看

教据中心建设作为一种战略投入基本上已经形成共识,但是在巨额的投入后仍面临着种种问题与风险,面临着数据量急速膨胀,场地严重不足,运营成本高昂、能耗大、安垒性差,业务连续能力低等一系列挑战。

在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理就是为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。对于很多数据中心来说,保障和提高数据中心运维管理绩效是现在数据中心亟待解决的问题。

那么在数据中心运维管理工作中到底存在哪些问题呢?小编做了以下总结:

(1)运维人员不了解系统规划情况主要工作局现在对设备的维护上;

(2)简单的依照标准确定运维内容,包括一些不重要、无关紧要和不对的指标;

(3)机房环境指标指示不正常(温度、湿度、正压等),不知道如何改变制冷设备设置,使系统运行达到最佳状态;

(4)供电系统异常(接地、零地电压、干扰、IT设备异常)时,只知道在供电设备上查找原因,而最终不能解决问题;

(5)管理界限不清楚,只维护部分基础设施设备,忽略或不维护发电机和空调室外机等;

(6)只维护关键设备,对发电机、电池、配电、线缆长时间不做维护;

(7)设施文档不全面或不正确;

(8)发生事故时简单地归结为设备问题,不愿也无法找出引发事故的真正原因,以至于故障修复后再发生故障,或诱发其他环节故障。

(9)对设备和系统的智能监控管理功能不熟悉,已有的智能管理功能不能得到充分的利用。

(10)无专门维护人员配制,或维护人员不专业;

(11)管理制度不健全,缺乏维护操作流程,无严格的交接班制度。

这些问题无一不会对数据中心的运维工作带来挑战,只有正确解决这十一个方面的问题,才能让数据中心保持长期稳定运行,并能产生良好的效益;也是数据中心运维水平高低的主要重要体现。

本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
【ACE Meetup天津站】云计算时代的运维管理
此次Meetup 中,主讲嘉宾于梦洋老师就云计算、大数据运维、分布式集群、自动化运维管理等多方面,与在场成员进行了详细介绍和交流。
995 0
工作半年遇到最奇葩的问题
工作半年遇到最奇葩的问题 背景 公司最近买了一套项目,在启动的时候出现了一系列奇怪的问题,对方的技术栈要求是Tomcat7启动,但是由于我们公司出于安全的考虑所以是要求用Tomcat9进行启动的。 问题描述 下面情况都是相同war包相同Tomcat情况下 系统 Tomcat版本 能否启动 Windows Tomcat7 能 Windows Tomcat9 能 macOS Tomcat7 能 macOS Tomcat9 不能 Linux Tomcat7 能 Linux Tomcat9 不能 由于对于项目的不熟悉,导致找了很久才找出来原因。
786 0
Hadoop - 企业级大数据管理平台CDH(介绍和准备工作)
哈喽大家好呀,仅经过了一段时间大数据相关的博文又和大家见面了,笔者之前有写过一套Hadoop大数据相关的博客,为什么今天又要开坑呢?当然是有原因,随着不断的学习了解,慢慢意识到之前做法存在很多缺陷,最终对比了比较成熟的解决方案EMR和CDH,最终选择了使用CDH来搭建大数据管理平台,那么我们就开始新的一趴,企业级大数据管理平台CDH的学习吧!
420 0
+关注
5518
文章
253
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载