汉得信息郝文:大型软件系统运维之道

简介:

9月8日,由上海市国资委指导,上海市国有资产信息中心主办,畅享网提供媒体支持的走进太平洋保险集团——信息化系统运维专场活动沙龙在太平洋保险大厦圆满举行。沙龙活动针对信息化系统运维工作中面临人员成本高、保障效率低、外包服务不满意等诸多问题,以优秀企业成功项目为例,分享经验做法,研讨解决方案。


640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=

2017-09-25-3162bf7f0b-af02-4693-a766-86c

以下为汉得信息AMS 1部总经理郝文的讲话内容,他的演讲主题为《大型软件系统运维之道》,畅享网整理节选。

第一个案例:A集团(国内某知名电器集团)

A集团以Oracle、ERP为核心统一运维,整个运维团队超过100人,这100人全部是汉得的顾问在支持,会有六七个人在负责事件管理,叫做事件经理,进行运维管理、运维体系建设以及运维质量的持续改善。

A集团现在是第四年运维,人员稳定性很高。因为大型企业的运维,哪怕不是汉得一家去做,是企业自己招的100人去做,都需要首先保障这些人的稳定,有了人员稳定和服务体系,接下来才能去改善它的体系,这是做传统运维一个根本目标。因为A集团三年前自己在做运维,不同的系统、不同供应商在零散做运维的时候,有它自己的运维体系和平台,包括事件管理、变更管理、运维的分析等一套自己成熟的东西。

A集团做统一运维,特别由一家运营商承接所有工作,有很大风险和挑战。它为什么做统一运维呢?无非是“多、乱、散、贵”。针对这四个方面的问题,A集团决定把所有系统全部打通,进行统一运维。就这样,汉得承接了统一运维的工作。

第一、他发现将近两三百人的团队,一下缩减了一半还不止。

第二、原来做运维的人去了开发团队、去了业务团队,发挥更大的价值,人员的稳定性提升了。

第三、这个项目运维这块把它整个的资源、精力分担出去以后,A集团还构建了一个大型项目,这个项目的成功跟大运维密切相关。企业做一些数字化的转型,做一些IT到业务价值的提升,做大运维,需要把一些B端的标准化业务外包出去,这样会运营更轻松、资源更投入地去应对新的转型变革。

我们做的事情总结下来是六个,也是六个目标。

(一)服务质量。我们通过统一替代零散,服务质量得到提升。这不止是一个量级的提升。怎么提升服务质量呢?无非通过零散服务统一服务体系、统一考核,严格按照KPI去梳理,通过各种考核手段提升服务。

(二)管理\考核体系。由运维体系支撑,包括一些管理制度、流程、考核规范、针对员工的KPI考核,构建了这套运维考核体系。

(三)资源共享。我们提出了AB角的策略,有了AB角,A角流失了B角可以顶上。同时要求各行业线可以相互打通。

(四)知识沉淀。有了前面的基础很容易做到知识沉淀,特别是考核和KPI约束。

(五)B\R转换。

(六)人员稳定。

这六个目标具体怎么达成呢?

第一、人力的保障,汉得有庞大的资源给A集团保障,但是具体大运维、统一运维的时候,需要的不仅仅是人力支持。

第二、保障人员的稳定性。我们给A集团在当地成立的一家公司做了人员的培训、升级、激励,同时,还有一套科学严密的运维流程和体系规范,包括知识库、用户培训、AB角、奖励、满意度等等。

在人员提升方面,有了培训的素材因子之后,内部有一套针对项目的晋升体系。我们公司的咨询顾问体系跟行业相关,我们有30多套行业解决方案。在服务流程体系方面,有各种人员的进场、晋升的流程。整个ITO的运维管理不仅仅是解决问题,还包括管理、管理体系、日常运作、考勤流程,甚至是项目。

第三、KPI到个人。满意度管理,很多客户感兴趣怎么去做满意度落地。A集团是采取了惩罚的满意度管理方法,其实B公司采取的奖励方法,每个问题解决之后只要用户满意都会发表扬信,这两个企业的风格是不一样的。

第二个案例:B集团(世界500强企业)

B公司案例的特点是:

第一、全球运维,要一个团队支撑亚洲、欧洲、美洲不同时区业务,我们要保证多语言、不同时区之间的交界,能顺利承接。

第二、B公司模式跟A集团模式差别最大的是,A集团会有七到九个事件经理跟我们一起做运维体系,但是B公司只有一个人,他就是管我们的KPI。所有的体系、问题解决、服务质量全部自己搞定。

第三、把我们扔在自建的ODC里面做这个支持,他每个月只看KPI是否达标。大家可以想像KPI要有多细,基本上是小数点后两位,如果差一点质量会大幅下降,我们的收款会遇到严格的考验。

所以A集团跟汉得共建中心,共同做持续的改善。B公司把这一块变成服务交付给它,它只管结果,这是两个根本的不同。同时在结算模式上不一样,因为A集团是共建的,所以按人力的模式,我买你100人去做。B公司是不管你有多少个人,帮我搞定多少个事件,我只看多少个事件单,我一个单给你多少钱。包括场地、交接、管理全部含在这个事件单了,一口价,这是一个模式的创新。

在B公司我们做了几方面的工作:第一,按照B公司的信息安全要求,在汉得园区里面构建了B公司远程交互中心。因为我们做运维业务,是直接接触生产环境账号的,所以安全是第一位的。第二,因为是7乘24小时,所以是很多团队在支持。我们还增加了白班解决率和夜班解决率,还有在线支持接通率,未来总体就是降成本、降人力。

总的来说B公司的模式就是轻资产。在运维这块轻资产也是有好处的,除了人力、场地,还包括知识都是轻资产、标准化的。这个对大型企业而言不一定是个必然选择,但是是可选的一条路。

第三个案例:C公司(国内知名食品企业)

C公司的特点是叫做可量化的服务标准与基线。A集团按照人力输出共同构建的形式,按照SLA来,SLA有不同的层次,比如技术层面,如果是合格的,基本的钱能给你。这会有个问题,供应商达到这个水准和基线就原地不动了,我就收到钱了。这不是一个共同提升目标方向的事情,如果在基线之上不同的层次,再往上进一阶再给你更多的奖励,就像游戏打关一样,我会给你相应的奖励和合同金额。这是一个组合模式,是可以促进外包供应商不断提升的模式。

同时,肯定需要运维体系的方法和工具落地,以及层层去挖掘基于系统运营层面的东西。我们是基于这样的平衡计分卡的概念去运维层面进行层层剖析,来保证一个组合一个阶梯的往上提升,最后运营商有收益、客户也有收益,服务质量在不断提升,这是C公司的特点。

C公司用我们自己研发的工具,把它整个研发体系落地到我们的运维体系,包括一些运营分析,全部通过我们这个平台落地。我基于SLA生命周期的设计,这个比较复杂,具体看一个事件单过来了怎么样处理、走什么样的路径,以及到下一个阶段有怎么样的KPI输出等等。

接下来,基于云的机构的案例

第一个是D公司(某知名服装企业),它敏捷性的应用要求很高,和传统运维做的事情不一样,我们发现核心模块很简单,就是门户再加订单的枢纽,我们处理各种各样的接口,跟外围、电商的,基础架构这块发现有微软云,也有本地的IDC,我们怎么样做好混合云的运维支持。既要有懂云的人,还要有懂IDC的人,还要懂它们之间的接口怎么去处理。

基于云的运维,像双十一,要有现场的支持体系,遇到问题随时响应。同时加了一些DevOps架构,区别就是高并发。一个是面向数据导向,一个是面向用户导向,我们要变被动为主动,用工具化、自动化的形式去实现。

第二个是基于云的车联网案例,我们面向整个车厂去推解决方案,这个模式我们也是在探索,我们更多在运维模型做延伸。刚开始方案不一定成功,可能推了100辆车有这个电子设备。刚开始很难测算整体未来的费用,如果推成功未来有几十万辆车用这套设备。这个时候运维费用不是线性增加,是一个曲线性增加。我们期望在这种新型的工作模式下——跟客户一起绑定去输出解决方案的时候,随着业务量的扩大,我们提供的运维模型总的费用是一个逐步提升的过程,但是单个车辆、单位的费用是持续下降的,这样才能构成供应的层面。对企业而言、对解决方案商而言,设备需求多,它也更愿意做好增量的支持。销量好,有多余的费用,相应的费用也是可以得到提升的。





本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
目录
相关文章
|
18天前
|
机器学习/深度学习 运维 监控
智能监控系统在运维中的应用与优势
传统的运维管理方式在面对日益复杂的IT系统时显得力不从心,智能监控系统的出现为运维工作带来了新的机遇。本文将探讨智能监控系统在运维中的应用与优势,介绍其工作原理以及如何有效地利用智能监控系统提升运维效率和质量。
33 2
|
25天前
|
运维 监控 安全
现代化运维管理系统的关键特征与实践指南
在当今数字化时代,现代化运维管理系统正日益成为企业提升效率、降低成本的关键工具。本文将深入探讨现代化运维管理系统的关键特征,以及实践指南,帮助企业更好地应对技术挑战,提升运维效率。
|
27天前
|
人工智能 运维 监控
现代化运维管理系统的关键性作用与挑战
随着信息技术的快速发展,现代化运维管理系统在企业中扮演着越来越重要的角色。本文将探讨现代化运维管理系统的关键作用和面临的挑战,帮助读者深入了解该领域的发展趋势。
|
28天前
|
人工智能 运维 监控
现代化运维系统的关键技术与挑战
随着信息技术的快速发展,现代化运维系统成为企业管理的重要组成部分。本文将探讨现代化运维系统中的关键技术和面临的挑战,从自动化运维、容器化技术到监控与安全性等方面展开讨论,帮助读者更好地理解和应对运维领域的挑战。
|
29天前
|
运维 Prometheus 监控
构建高效自动化运维系统的关键策略
【2月更文挑战第30天】随着云计算和微服务架构的兴起,现代IT运维环境变得愈加复杂多变。为保持业务连续性、提高响应速度并降低成本,企业亟需构建一个高效的自动化运维系统。本文将深入探讨自动化运维系统构建过程中的关键策略,包括工具和技术选型、流程优化、监控与告警体系搭建以及持续集成/持续部署(CI/CD)实践,旨在为读者提供一个清晰的构建蓝图和实用的实施建议。
|
6月前
|
存储 运维 算法
|
29天前
|
人工智能 运维 监控
构建高性能微服务架构:现代后端开发的挑战与策略构建高效自动化运维系统的关键策略
【2月更文挑战第30天】 随着企业应用的复杂性增加,传统的单体应用架构已经难以满足快速迭代和高可用性的需求。微服务架构作为解决方案,以其服务的细粒度、独立性和弹性而受到青睐。本文将深入探讨如何构建一个高性能的微服务系统,包括关键的设计原则、常用的技术栈选择以及性能优化的最佳实践。我们将分析微服务在处理分布式事务、数据一致性以及服务发现等方面的挑战,并提出相应的解决策略。通过实例分析和案例研究,我们的目标是为后端开发人员提供一套实用的指南,帮助他们构建出既能快速响应市场变化,又能保持高效率和稳定性的微服务系统。 【2月更文挑战第30天】随着信息技术的飞速发展,企业对于信息系统的稳定性和效率要求
|
3月前
|
弹性计算 运维 安全
ECS系统如何高效运维|开发者分享会
今天分享的内容来自阿里云弹性计算技术专家郑大禹的“ECS系统高效运维实践”。全文围绕ECS运维的痛点和挑战、如何实现高效运维以及典型案例分享这3个主题内容进行讲解。
111421 4
|
23天前
|
运维 监控 数据可视化
现代化运维管理系统的关键特性及实践应用
随着信息技术的迅猛发展,现代企业对于运维管理系统的需求日益增长。本文将探讨现代化运维管理系统的关键特性,以及在实际应用中的重要性和优势所在,帮助企业更好地理解和应用现代化运维管理系统。
13 2