CIO烦恼之六:系统一旦发生宕机,损失巨大。如何保证系统连续性?

简介:  信息系统经不起哪怕一次失误,尤其是对银行、电信等大型企业来说,信息系统保持良好的稳定性和连续性比什么都重要。
 信息系统经不起哪怕一次失误,尤其是对银行、电信等大型企业来说,信息系统保持良好的稳定性和连续性比什么都重要。

  当初海信集团CIO王志浩决定投入几百万上元马海信集团的容灾备份系统之时,很多人都觉得他是在浪费钱瞎折腾,如今容灾备份却已经成为了银行、电信等大型企业信息系统的必备保障系统。因为今天,信息系统在越来越庞大的同时,也隐藏了越来越多、越来越大的风险。比如银行业,系统宕机每秒钟所带来的损失以每秒数百万元计,电信企业也同样如此。而且对大多数企业来说,系统不稳定,无法保持连续性,商业机会就会在这样的延迟中不知不觉消失。

  CIO们开始背负新的压力,不仅要保持系统的高效运转,还要保持系统不会出现故障。因为IT系统担负着支撑企业转型、发挥价值链协同、提升业务能力和客户忠诚度的关键作用。正是由于信息系统重要性的日益提高,CIO的相应责任也在不断增加,他们保持企业信息系统高可用性和连续性的压力已经使得系统安全保障不是需要去做,而是不得不做。

  显然企业无论大小,都需要保障系统的连续和稳定,但IT应用成熟度各有差异,对IT全系统高可用性的需求层次和投资规模也各有不同。IBM大中华区全球信息科技服务部总经理张烈生曾经说过:“企业的可用性需求可以根据企业IT治理成熟度分为四个阶段:第一阶段的主要需求为系统级高可用服务,如主机高可用服务、单点故障分析等;第二阶段的需求重点在于容灾恢复,如安全系统部署、数据备份和恢复;第三阶段的重点在于信息生命周期管理、ITSM等服务管理;到达第四阶段,企业追求的是业务弹性,如SOA架构的规划、《萨班斯法案》的遵从、BS7799安全标准的遵守等。”

  回看各大厂商的业务连续性解决方案,尽管大同,但根据各自的特点仍有不同的侧重。IBM全球信息科技服务部强调的是通过业务分析、业务冲击力分析、恢复能力分析等,考量企业可能遇到的各种风险,预估业务中断造成的损失状况, 从而为业务持续性计划的制定提供借鉴依据。而CA公司则在近期通过收购业务连续性软件厂商XOsoft加强了自己在提高企业业务连续性方面的能力。HP则一直自诩在中国业务连续解决实例方面“身经百战”——在制造,金融,电信,政府等多个行业均有成功案例。

  不过根据调查,国内大多数大型企业仍旧处在维持系统高可用性的初级阶段,投资规模一般在百万元级别,而达到第三和第四阶段的公司依然很有限,因为这更多需要的是企业整体意识和信息化管理水平的提高,而不是CIO简单通过系统模块的增加便可以解决。

 
相关文章
|
11月前
|
负载均衡 API 数据库
【韧性架构设计】软件韧性:从意外中恢复的 7 个必备因素
【韧性架构设计】软件韧性:从意外中恢复的 7 个必备因素
|
12月前
|
缓存 JSON 运维
如何避免大规模线上故障
如何避免大规模线上故障
107 0
|
SQL 缓存 安全
如何做好大促时的系统高可用
面对大促不确定的流量,我们需要做好全方位的流量控制与防护能力,确保我们的系统始终工作在预期的范围之内。首先我们需要有流量的实时监控以及水位诊断分析能力,确保我们知道当前系统所处的一个状态;在业务的链路入口,我们需要做好链路入口的容量评估以及峰值流量的限流配置、同时需要开启热点隔离能力,防止黑马商品、黑产刷单等不确定因素造成的稳定性影响;在微服务内部我们需要配置单机流控,针对微服务内部异步的流量我们可以配置流量平滑能力做到削峰填谷的效果;针对下游依赖的服务以及组件(数据库、缓存等),我们可以通过慢SQL发现以及熔断、慢调用隔离、热点探测等手段保障稳定性。
如何做好大促时的系统高可用
|
运维 数据挖掘 测试技术
谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧(一)
企业管理软件面向的是企业级用户,如果软件出现故障(bug),在某些极端情况下,可能会让企业蒙受巨大的经济损失,故而对软件开发人员在编程规范,软件测试和软件交付之前的验证等各方面都提出了更高的要求。
117 0
谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧(一)
|
程序员 测试技术 BI
谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧(二)
企业管理软件面向的是企业级用户,如果软件出现故障(bug),在某些极端情况下,可能会让企业蒙受巨大的经济损失,故而对软件开发人员在编程规范,软件测试和软件交付之前的验证等各方面都提出了更高的要求。
127 0
谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧(二)
|
缓存 中间件 Java
任务悬赏app源码,保证系统稳定性需要做好哪些事
任务悬赏app源码,保证系统稳定性需要做好哪些事
|
存储 Cloud Native 安全
稳定性「三十六计」- 无状态化
稳定性「三十六计」- 无状态化
|
运维 监控 前端开发
开发人员该如何应对线上故障
开发人员该如何应对线上故障
376 0
开发人员该如何应对线上故障
|
运维 数据挖掘 BI
从一个 SAP CRM 软件实际的故障处理出发,谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧
从一个 SAP CRM 软件实际的故障处理出发,谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧
从一个 SAP CRM 软件实际的故障处理出发,谈谈企业管理软件领域内那些很难稳定重现故障的处理技巧
如何构建一个拖垮整个公司的备份系统
在如今“数据即资产”的时代,有备才能无患。备份就像备胎,虽然大多人都知道备胎很重要,却很少有人检查。不发生点什么,你永远不知道TA对你有多重要。
6016 0
如何构建一个拖垮整个公司的备份系统