云数据中心呼唤安全可控的数据中心运维

本文涉及的产品
云防火墙,500元 1000GB
简介:

摘要:构造安全可控的云数据中心运维体系,成为运维工作的重中之重,而数据中心的安全防护、运维管理和客户服务则是三个重要抓手。

随着新技术新业务的不断发展,现代数据中心发生了很多变化:资源规模及维护压力快速增长,客户需求越来越多种多样,数据中心迅速走向集中化、规模化,大型数据中心成为主流,越来越多的云业务代替传统租赁托管业务……这些变化都要求数据中心踏上整合、云化之路,同时也给安全管控、资源管理、配套供给、绿色节能等方面提出新的挑战。因此,构造安全可控的云数据中心运维体系,成为运维工作的重中之重,而数据中心的安全防护、运维管理和客户服务则是三个重要抓手。

数据中心运维

  打造三位一体的安全防护铠甲

2012年6月29日,强雷暴天气下发电机失灵,导致亚马逊停运;2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在物理安全、系统安全及数据安全三个层面加强防护,构造三位一体的坚固铠甲。

物理安全,重点在于出入安全和操作安全,需要在门禁安检、多点监控、区域管理、安全记录、授权管理、进出管理等方面梳理并完善物理安全管理制度及措施。同时可以运用先进的安防手段,比如在安检系统上配置X光机和闸机,在门禁系统上配置防尾随系统等安保系统,这些都是保障物理安全的“利器”。

系统安全,主要是通过实现供电零终端、制冷不间断、网络高可靠等措施来保障系统安全稳定地运行。在系统安全领域,越来越多的新兴技术手段正得到运用,例如利用高压发电机组自动并机发电,保证不间断供电,当市电发生断路,切换柜自动切换至油机发电;又比如模组机房采用封闭冷通道,规避局部热点,使用列间空调,实现精确送风,从而提高制冷效率。

数据安全,除了传统意义上的防火墙部署、入侵检测IDS、网站防护、网页防篡改等,云数据的安全防护,成为云数据中心在安全领域面临的一个重要挑战。在云时代,由于数据被打散,资源池内不同虚拟机间的数据入侵、数据泄露等问题引起了人们越来越多的关注,也相应出现了很多防护措施,比如在IDC云平台上部署虚拟化安全软件,在宿主机内部署三层虚拟网元(入侵检测、防火墙、漏洞扫描等),通过其控制虚拟机间的访问,能够初步实现虚拟机间的安全防护。

构建“4+1”集中运维管理流程

伴随着数据中心规模越来越大,业务需求也越来越多样化,维护压力同步增长,所以集中化成为必然。所谓集中化的运维管理,就是通过完善IDC业务质量监控指标,同时建立IDC业务质量管理流程,在机房管理、动环管理、网络管理、云管理、业务管理等方面实现集中监控、集中维护、集中性能、集中资源以及绿色节能管理等功能,即实现具有“四个集中”和“一个绿色”的“4+1”集中运维管理。

集中资源的重要性不言而喻。伴随着互联网业务的蓬勃发展,IDC业务发展越来越好,需要管理的资源就越来越多,如何有效管理众多资源成为IDC运营的关键。在资源集中管控中可以通过三个最重要的技术手段,即全生命周期资源管理、跨数据中心资源共享以及精细化管理云资源平台来实现IDC资源的集中化运维。

为了实现集中监控与集中维护,可以通过建立IDC集中监控平台,将机房、动力、消防、资源、系统、业务、应用数据等信息纳入集中监控之中,将告警输出至集中故障平台来进行统一派单;监控人员对IDC设备实行724小时运维管理,同时建立跨专业的现场运维团队,实施IDC问题三级响应机制,探索智能维护之路。

对性能的集中监控,就是借助云计算技术,从网络、服务器层面,来实时定位交互过慢、网络质量劣化等多维度复杂的性能问题。比如,当数据库、媒体业务应用虚拟机同受一台主机控制时,当数据库用户反馈查询速度慢时,就可以通过KQI/KPI关联分析,定位原因为媒体业务IOPS高,造成数据库应用响应时间长,并通过迁移数据库应用或限制媒体业务IO次数等措施解决问题。未来的云数据中心还将以云性能为重点,面向APP、云资源池等层面,开展性能管理研究。

绿色节能管理,就是从供电、制冷、云计算、IT设备等多个维度,应用多种资源自动化调度策略,根据云平台负荷动态调整供电、制冷量,确保设备可靠运行,获得最优PUE(数据中心总设备能耗)。在业务主机方面,通过积极应用云计算和绿色IT设备,实现主机维度节能管理;在机房层面,通过热仿真、模拟和勘测打造绿色机房,从而建设绿色数据中心,实现节能减排。

IDC的集中化运维管理,最终想要达到的目标是建立IDC运营管理支撑平台,对IDC各项资源进行集中监控、集中维护、集中性能,实行集中化管理运营,将告警、资源等指标与客户进行关联,实时向客户推送告警,开展IDC主动服务。

提供差异化全生命周期客户服务

IDC服务也需要不断地探索和提升,提供差异化全生命周期客户服务。

提升IDC服务,可以按照服务响应、服务交付、服务管理三个维度,构建IDC标准服务流程。可以采用的服务响应渠道包括电话、E-MAIL、门户网站、微信公众号等。在服务交付上,可按照客户等级和对IDC业务保障的重视程度,将IDC业务服务级别进行划分,从售前、售中、售后三个阶段,为客户提供差异化的、具有等级的服务,从而实现IDC增值服务能力和运营能力的提升。例如互联网公司可以将设备通过物流寄送到数据中心,由数据中心代为上架、布放线缆,在网络调通后再由互联网公司远程调测,这样对于客户而言无疑是更方便的解决方案,自然会赢得互联网公司的青睐。

伴随着新技术的不断发展,特别是大数据云计算时代的到来,IDC面临的传统和新兴的叠加挑战会越来越多,运维技术的发展和能力的提升也是必然的发展趋势。以安全、质量、服务为核心,夯实IDC安全管理,提升IDC业务质量,为客户提供标准化的全生命周期服务,探索构建IDC运维管理体系,将是每一个运维人不断探索和追求的目标。

本文转自d1net(转载)

目录
相关文章
|
1月前
|
运维 监控 安全
安全运维:入侵检测与防御实战指南
安全运维:入侵检测与防御实战指南 【10月更文挑战第9天】
109 3
|
8天前
|
人工智能 运维 监控
智能运维在现代数据中心的应用与挑战
随着云计算和大数据技术的迅猛发展,现代数据中心的运维管理面临着前所未有的挑战。本文探讨了智能运维技术在数据中心中的应用,包括自动化监控、故障预测与诊断、资源优化等方面,并分析了当前面临的主要挑战,如数据安全、系统集成复杂性等。通过实际案例分析,展示了智能运维如何帮助数据中心提高效率、降低成本,并提出了未来发展趋势和建议。
|
2月前
|
消息中间件 运维 安全
云消息队列 ApsaraMQ Serverless 演进:高弹性低成本、更稳定更安全、智能化免运维
在 2024 年云栖大会上,阿里云智能集团产品专家刘尧全面介绍了云消息队列 ApsaraMQ Serverless 的落地成果和产品进展。此外,我们还邀请到杭州优行科技有限公司中间件消息研发负责人王智洋,分享了 ApsaraMQ for Kafka Serverless 助力曹操出行实现成本优化和效率提升的实践经验。
154 8
|
1月前
|
运维 网络协议 安全
Linux安全运维--一篇文章全部搞懂iptables
Linux安全运维--一篇文章全部搞懂iptables
42 1
|
3月前
|
运维 监控 安全
运维之道:构建高效、稳定和安全的系统
在数字化时代的浪潮中,运维(运营与维护)的重要性日益凸显。本文深入浅出地探讨了如何构建一个高效、稳定且安全的系统,从基础设施的搭建到日常的监控管理,再到安全防护的策略实施,每一个环节都是确保业务连续性和数据安全的关键。通过实例分析和最佳实践的分享,旨在为读者提供一套完整的运维解决方案,帮助团队提升运维效率,降低风险,保障业务的稳健发展。
|
3月前
|
运维 安全 网络安全
云端安全之盾:云计算与网络安全的协同演进运维自动化之路:从传统到现代化的转变
【8月更文挑战第23天】在数字化浪潮下,云计算以其灵活性和可扩展性成为企业数字化转型的重要推手。然而,随着云服务的快速发展,网络安全威胁也日益增多。本文将探讨云计算与网络安全如何相互促进,共同成长,以确保信息安全,并分析云服务提供商采取的安全策略以及企业在采用云服务时应注意的安全实践。
|
3月前
|
运维 数据库 数据库管理
云数据库问题之阿里云在运营商领域数据库替换的整体解决方案要如何实现
云数据库问题之阿里云在运营商领域数据库替换的整体解决方案要如何实现
|
1月前
|
缓存 弹性计算 NoSQL
新一期陪跑班开课啦!阿里云专家手把手带你体验高并发下利用云数据库缓存实现极速响应
新一期陪跑班开课啦!阿里云专家手把手带你体验高并发下利用云数据库缓存实现极速响应

热门文章

最新文章