数据中心网络运维必杀技满满“套路”得人心

简介:
+关注继续查看

“重复劳动,效率低下,事情繁杂,出事背锅”。这是一直以来数据中心网络运维人员的切身感受。数据中心运维本来就是一个复杂的事情,用一个公式可以感受其中的难度:“数据中心运维综合复杂度=网络技术*服务器技术*业务系统*工具*流程管理”。

随着业务不断增长,数据中心常见规模从以前几个机柜,发展到如今成百上千个机柜,原先相对简单的运维工作,复杂程度呈几何系数的增长。这背后,是一大堆相关部门的协同工作,是夜以继日的开会、协同办公,是运维人员的苦不堪言。

怎么办?新华三的专家们给出的答案是“自动化”。如图一所示,在一台设备的整个生命周期内,除了采购、上架/下架等工作必须要人来做,其余的配置、镜像校验、上业务、变更配置等工作,都是可以通过自动化来实现的。

2016-09-01-11a257d9a1-3bf5-4112-b468-283

套路一:设备自动化上线

网络设备的自动化上线又可以称为做自动化部署,其中的难点就在于如何确定“自动化上线”的这台设备是一台“怎样的”设备。这就需要在自动化部署之前,提前规划好设备的耦合关系。

这些具体的“耦合”包括了设备的序列号、其所在的物理位置、这台设备的“身份”,以及,其网络配置,包含基础配置如SNMP、AAA、链路聚合、网络管理等,以及专属配置如接口业务VLAN、IP地址信息、设备命名、描述信息等。

准备工作做好之后,其他的工作就可以“自动”了。在具体实现途径上,新华三提供了两种不同的思路。一种是Python脚本方式,利用Python脚本,一一完成设备定位和配置工作。

另一种则是LLDP方式,这种部署方式通常用于增量设备部署。这种方式利用LLDP的邻居发现特点,自动发现新增设备的物理所在位置,从而决定网络设备的身份和角色。

套路二:配置自动化变更

如今,数据中心运维人员还在持续使用CLI、SNMP等传统网络管理方式的话,那就太OUT了。Netconf(Network Configuration Protocol 网络配置协议)是现在运维人员眼中更高效、更便捷的网络配置管理方式。它提供一种可编程的、对网络设备进行配置和管理的方法,可以通过该协议设置参数、获取参数值、获取统计信息等,第三方开发也非常便利,很容易开发出在混合不同厂商、不同设备的环境下的特殊定制的网管软件

在新华三的解决方案中,借助Netconf,解决了很多传统网络配置工具所难以实现的工作。如实现批量获取设备的数据,实现批量修改设备配置数据,对不同厂商不同品牌的网络设备实现统一封装,标准化配置管理,减少甚至禁止人工对网络设备的直接操作,减少误操作几率,强化操作审计等。

现在,越来越多的IaaS基础架构采用OpenStack及OpenStack相关的商业定制版,在这些云环境中,如何实现自动化呢?

答案就是借助H3C Neutron Driver。面对开源社区版OpenStack、H3C CloudOS或者其他商业定制版OpenStack,H3C Neutron Driver都能够实现配置自动化部署,让用户的云运维更加轻松。

套路三:设备智能化

如今的网络设备,已经不再是“黑盒子”的概念。SDN的火热,也带动了网络设备的可编程能力。例如新华三旗下的数据中心级网络设备均已支持SNMP、CLI、WEB、Python、Netconf、REST、XML、Bash、TCL等开放可编程方式,还从多个维度开放API接口供业务编排。

说到SDN,必然要提起H3C VCFC控制器。大家都知道,OpenStack是从系统视角出发,把网络视为是一根根的导线,但是对更复杂的资源对应没有做深入定义。

对此,新华三认为,光有资源分配的入口还不行,需要SDN控制器(即VCFC)作为资源的调度中心,这样的云环境才足够智能。

套路四:可视化监控

随着网络的不断发展,越来越多的业务对网络质量产生了更高要求,而这些要求在运维人员看来很多时候无从下手,因为没有一个专门的工具或者平台来完成这些工作。

新华三正是看到了目前运维对网络可视化的需求,从网络设备本身角度出发,做到了流量可视化、缓存可视化、芯片可视化。

不仅如此,新华三更近一步,实现了网络路径的可视化。在将网络路径拓扑呈现的基础上,结合H3C VCFC控制器和网络管理平台,针对VxLAN环境和传统IP网络环境,帮助数据中心运维人员通过不同的技术,实现一致的路径展示。

套路五:运维大数据

如何利用好运维数据才是体现运维服务业务的价值关键。新华三提出了运维大数据的“相关性网络”概念,将IT运维过程中各个信息元素进行关联,对其进行数据挖掘,提炼出运维维度的相关性。

具体来说,就是将运维工作划分成网络流量预测、网络性能预测、网络容量预测、故障预测等几个维度。根据历史数据,形成对未来网络流量、容量等方面的预测,给运维决策提供依据,并且利用运维大数据平台,将日志、告警、snmp、syslog等信息做统一收集,做数据转换后形成故障推理,帮助用户在一堆日志告警中精确判断真正故障原因。

结束语

以上就是新华三针对数据中心运维提出的“五大套路”,套路背后,新华三更在乎的是在这些运维自动化的手段给用户带来的价值,将“套路”变成运维的“思路”。多一些“套路”,多一些真诚,面对压力重重的数据中心运维工作,这种套路,希望还是越多越好。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
目录
相关文章
|
安全 网络安全 数据安全/隐私保护
面对未来网络安全 如何做到一劳永逸?
面对未来网络安全 如何做到一劳永逸?
面对未来网络安全 如何做到一劳永逸?
|
固态存储 Java 区块链
浅谈技术管理之日式管理的殊途同归
《周易》说,形而上者谓之道,形而下者谓之器;降龙十八掌里有履霜坚冰,夕惕若厉等招数;坤卦爻辞中也有含章可贞,或从王事等管理和做人规则。 看完上面几句,大家可能会想,不是说日式管理嘛,怎么说起中国传统哲学了?其实无论是西方的还是日式的管理方法与经验,其理论来源都是中国的哲学思想,无论是德鲁克的任务、责任、实践的管理理论,波特的差异竞争论,哈默尔的核心竞争力,还是明茨伯格的战略和经理人角色,科特的领导与变革,归根到底这只不过是一些管理的方法和手段而已,这些手段和方法,在浩淼的中国传统哲学中都能找到与它们几乎一致的理论,可以说中国的哲学思想是世界管理学的源头活水。 说到日式管理,很多人也都耳熟能
112 0
|
运维 安全 大数据
如何做好大企业的安全管理
这篇文章里很多观点,是从企业整体管理的角度看待问题的。毕竟安全是公司的一个部门,是为公司整体业务的发展而存在。不论安全如何出色,最终的结果是要帮助公司存活、盈利,只有公司发展起来,安全才能获得更大的发展。所以,希望各位仅仅搞信息安全和风险合规的读者,要跳出本位主义,跳出你框框来看问题。
444 0
|
运维 测试技术 开发者
新世界由你造,欢迎加入阿里云效团队!
如果你对研发技术有更高的追求,如果你想和阿里技术大牛们一起创造未来,加入云效,实现你的梦想!
3865 0
|
测试技术
《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药 2011年2月1日
本节书摘来自华章出版社《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药,2011年2月1日,作者:(美 )Eric Brechner 著 林锋 译.更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1253 0
|
测试技术 项目管理 数据库
《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药 2010年10月1日
本节书摘来自华章出版社《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药,2010年10月1日,作者:(美 )Eric Brechner 著 林锋 译.更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1357 0
《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药 2005年4月1日
本节书摘来自华章出版社《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药,2005年4月1日,作者:(美 )Eric Brechner 著 林锋 译.更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1261 0
|
资源调度
《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药 2002年9月2日
本节书摘来自华章出版社《代码之殇》(原书第2版)——第2章 过程改进,没有灵丹妙药,2002年9月2日,作者:(美 )Eric Brechner 著 林锋 译.更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1198 0
相关产品
云迁移中心
推荐文章
更多