前两天坐飞机,刚好在飞机上又温习了一遍Sandra Bullock主演的《瞒天过海:美人计》,里面有个镜头令人印象深刻,那就是电影中在大都会博物馆举行派对的现场,Sandra Bullock设计的在厕所换掉钻石项链的环节,厕所门口的摄像头被移动了位置,从而无法拍到关键嫌犯的影像资料。
有意思的是,类似的情况在国内的办案场景中也屡见不鲜:比如地方公安辖区内大量的摄像头需要维护,摄像头坏了会自动报修,这个不难;真正的IT维护难点在于摄像头是处于工作状态的,但是由于树叶遮挡或者传输质量、带宽等情况,造成录得的影像看不清,办案人员在需要用到这段影像的时候才发现问题。
换句话说,今天的IT运维,已经不仅仅是IT运维本身,而开始步入到运维、运营一体化的阶段。面对这样的现实问题,我们如何应对,成为7月初于成都举行的华为中国企业运维峰会2019上重点探讨的议题之一。
运维需求升级
我们知道,运维的本质是为了让系统安全、稳定的运行,系统“活着”是核心。
而今,越来越多的行业都进入到数字化转型的加速期。IDC报告称,在互联网、通信、银行之后,包括零售、汽车、电力、政府及公共事业、交通、教育等行业,都开始步入数字化转型的爆发期。
然而,数字化转型既然叫数字化,数据成为核心,而数据是实时产生、流动并积累的,这时候,运维就需要向运营延伸。
从这一角度,IT系统不仅要活着,而且要活得好——系统性能、用户感知体验、业务的运营效率都得到了更多的关注。一句话,运维和运营正在趋向一体化发展——今天的IT运维,不仅仅是IT运维本身,而开始步入到运维、运营一体化的阶段。
地处北京周边的国网冀北电力公司,也遇到了类似的问题。
“我不怕数据业务不通,因为数据业务不通我们可以很容易进行精确定位,麻烦的是经常有地市公司申报网速的问题。”国网冀北电力公司相关负责人解释说,“网速慢的问题不容易定位,有次我们排查了几天时间,最后发现问题出在业务主通道中断,走了备用通道中慢的那个。”
应该说,国网冀北电力公司不仅地处西电东送和北电南送关键节点,承载着保障北京供电安全的任务;还因为冀北地区张家口、承德丰富的风电和光伏资源,承载着服务国家新能源战略的任务。同时也因为冀北清洁能源丰富,近年来冀北地区的云计算中心发展得越来越多,规模越来越大,这些都为国网冀北电力公司的运维提出了新的挑战——事实上,建设、运营泛在电力物联网,网络感知与应用平台相结合,已经成为国家电网的新战略。
I·MOC不仅仅是个平台
我们都知道,I·MOC是华为的统一运维平台,客户或合作伙伴可以根据客户的具体应用需求来开发细分行业的应用模块。不过,I·MOC还不仅仅是个平台。
我们知道,华为企业BG一直是“平台+生态”的战略,今年3月份在福州华为中国生态伙伴大会2019上,华为加持自己在AI方面的全栈能力,将战略升级为“平台+AI+生态”。因此,I·MOC下的Video Insight模块,加持了AI的能力,因此才能够在2个小时内完成8000多路视频巡检,实现视频诊断准确率达到95%以上的优异表现。
与此同时,华为也特别重视与生态伙伴的紧密合作。譬如国内知名的APM SaaS服务提供商听云,就是华为运维领域的重要生态伙伴之一。所谓APM,就是应用性能监控。
“在互联网公司一天TB级以上的日志数据里,怎么去找到某一个用户的某一个调用或者是某一个交易的投诉问题?”听云CEO张涛解释说,“其实这个时候你的思路要变,不是自下而上,而是应该从业务上,从用户视角要有应用性能的监控。”
数字化转型运维实践
正如张涛所说,在数字化转型期,企业最重要的是思路的转变。
“当发生业务问题的时候,我们需要快速、精准地找到多元数据的关联性,来分析故障问题。”张涛认为,今天管理的思路一定是业务视角,从用户市场向下钻,而中国的用户数量如此之大,应用环境如此复杂,同时中国的网络环境也空前复杂,因而中国在智能运维方面,借助得天独厚的数字资源和应用场景,会走得更快,更为领先。
“去年我们做了一个覆盖中国、法国等多个国家的车联网项目,客户自行评估即使不考虑跨国难度自建运维团队至少需要3-6个月的时间,并且还需要一年以上的时间去完善工具和流程磨合。”华为EBG中国区专业服务部部长王辉介绍说,“但业务的发展给不了这么多时间。于是客户通过与华为的合作,结合客户现有的人员、流程,以及华为的平台和运维专家提供的详细咨询分析、整体规划等方案,只用了1个月时间就完成了团队的建设,并投入正式的运维,获得远超客户期望的结果。”
在江西省,政务云以前是各个委办局采用分散运维,一个问题的解决往往需要网络、IT、安全、应用等多个部门的配合,有时需要2-3天才能够解决。
“华为根据客户业务的情况,协助客户成立了跨部门专项工作小组,构建统一的运维能力,部署统一运维平台,规划了三步走方案。”王辉举例,”第一步是集中监控,通过运维平台来实现面向业务资源监控,提前发现问题;第二步是标准化运维,结合运维的职能特点,优化事件管理、问题管理、变更管理、资产管理、应急管理等一整套的IT运维管理能力来提升运维的效率;第三步智能化运维,在经过精细化配置的基础上实现一定的巡检自动化、运维自动化。”
据悉,江西省政务云专项小组正式运作之后,运维效率提升了50%,通过主动预防和容灾演练补强,故障率下降38%,同时从运维到运营通过集中的管理,将业务上云效率从原来的5天缩短到0.5天。
加持五大智能引擎的I·MOC
应该说,数字化转型是一个长期的过程,只有通过持续的运营才能充分发挥新技术优势,把业务不断搬迁到集中化的平台上来,成本优势才能完全体现。
事实上,在业务大集中的基础上,企业获得的海量数据如何进一步产生价值,是运营阶段需要去挖掘的。华为在基于客户体验的性能提升、业务迁移、数据治理挖掘等方面积累的经验正逐步固化到I·MOC平台之上。
具体而言,华为在统一运维平台I·MOC基础上发布了五大智能引擎,其中包括主要面向各种行业应用的APP Insight;主要面向复杂的网络解决方案Event Insight;主要面向行业转型用到的无线网络Performance Insight;面向视频的Video Insight;面向物联网领域的IOT Insight。
IT运维正在与企业数字化运营紧密相连、息息相关。因而,每一家企业,都有必要突破传统思维,重新审视和考量自身的运维和运营一体化系统,不是吗?