谈谈那些计划内的停机

简介:

人们很少谈及的与技术有关的一个问题是,技术需要付出多少代价。大部分人把关注点都放在了技术带来的好处上面。无论怎样创新,技术都应该让我们的生活更舒适、更便捷、更智能,而不是让用户不得不忍受一些烦人的副作用。不过,从整体上来说,技术带来的好处太多了,所以现在人们也只能全盘接受了。智能手机就是这方面最好的一个例子。它可以让生活更轻松,甚至可以把它当成电视或者笔记本电脑。但代价是它需要充电,有时要一天两次。

伴随着服务而来的是计划内(或者定期的)停机。客户经常要忍受这些事情,之所以能这样做,是因为使用网上银行仍然比去营业分行方便得多——即使网站由于日常维护而经常性地关闭。

但是今天,风向变了。随着技术的发展,消费者的期望也在改变。当人们想要的更多,不太能接受有帮助的或者令人兴奋的创新带来的不便和延迟时,那么,他们就会觉得这些代价不值得。

对于大多数行业,这等同于所提供的服务出现了变化。挑剔、丰富的选择,消费者并没有意识到自己什么时候失去了耐心。如果不是随时可用,他们就不会感兴趣。当市场上到处都是竞争时,品牌忠诚度这个概念便不再适用。

这意味着,企业一直习以为常的事情,突然间成为消费者的大问题。虽然计划内的停机曾是大家可以接受的对无法提供服务的借口(或者至少是不可避免的灾祸导致停机),但企业应很快启用新备份,并支持创新,以确保真的能做到“永远在线”。

不断变化的期望

2017年8月,巴克莱银行宣布宣布近一百万客户在周末不能使用网上银行,也不能使用手机银行和电话银行服务。原因是什么呢?在全球金融危机爆发之后,他们正在拆分零售和投资部门,按照新法规要求,进一步加强后者的建设。

这类事情不是第一次发生。9月,广西移动在系统扩容过程出现故障,影响波及80万移动用户,导致用户2/3/4G所有业务无法使用。

或多或少,所有拥有大量数字资产的银行和消费者依赖型企业都会不时地进行“定期维护”。现在不同的是,令人震惊的事件越来越多的开始见诸于新闻。

当然,对企业来说,这个过程听起来还算合理。为了获得更大的利益而稍有些混乱也是值得的,因为要为所有人提供更好的在线服务。

但从消费者的角度来看:“您对自己的系统进行维护,为的是符合法规要求。但最终受损的是我们。”

突然间,计划停机看起来并不那么合理。

即使最终目的是为了保护消费者的财产,但也很难摆脱这样一种感觉,普通顾客总有那么几天不能查看自己的银行余额、支付电费,或者不能获得必要的服务。而且越来越有争议的是,那些计划停机的企业应该花更多的时间找到能够为客户提供最低服务保障的方法。而不是借口“计划停机”,因为这看起来就像是让“计算机说不”。

必须保持必要的基本服务

巴克莱银行的案例很有趣(同时也凸显了这一问题带来的相关话题),计划停机的问题不仅仅存在于商业和金融领域。

任何行业、部门或者企业提供的服务如果被视为“必需的”,那么,他们应开始思考怎样利用技术来确保客户能够访问他们所需要的一切——特别是隔离一台服务器进行备份或者维护时,一定要让另一台保持运行。

想想公共部门吧。停机带来的问题很容易导致人们对在线服务失去信心,至少,WannaCry事件表明了人们对公共部门不能提供服务非常不满意。

任何面向消费者的大型组织或者企业,都可以使用新的解决方案,让重要的工作得以进行。例如,在某些生产场景中,可以把数据备份到沙箱中。其双重优点是,在线保存重要系统,并能产生比标准的、单一应用程序沙箱更精确的结果,而后者没有考虑实际IT网络的复杂性。

这种维护方法带来的停机能够符合消费者的期望,(除非发生灾难)不会有任何问题。但仍然可以确保系统运行良好,完全是最新的。

可用性的未来演进

就在五年前,我们作为消费者或者企业还能接受和理解计划外停机是我们数字化体验的一部分。创新者应做一些有趣的事情,让我们的生活更轻松。如果这意味着时不时的中断,那就顺其自然吧。

但渐渐地,人们的期望改变了。更好的技术通常会带来更多的不耐烦,人们更不愿意去等待服务。定期停机开始成为头条新闻。最后,这变成了一个值得换掉供应商来避免停机的问题。

消费者渴望有更好、更持久的服务,这对于企业来说意义重大。其中最主要的是可用性的新含义,也就是说不会再有“计划停机”这样的词汇。和以往一样,企业和公共部门的领导人需要采取新技术变革,才能使之成为现实。





本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
目录
相关文章
|
3月前
|
Java Spring 监控
危机时刻,Spring框架如何拯救你的应用?深入探讨健康检查与自我修复功能
【8月更文挑战第31天】在现代软件架构中,应用的稳定性和可用性至关重要。本文介绍Spring框架中的健康检查与自我修复机制,通过Spring Boot Actuator的`/health`端点监控应用状态,并结合Spring Cloud Hystrix实现服务容错和断路器功能,提高应用健壮性。借助这些工具,开发者能轻松监控应用健康状况并在发现问题时自动采取措施,确保服务高可用性。要实现完善的机制,需根据具体应用架构和需求进行配置和扩展。
50 0
|
6月前
|
NoSQL 关系型数据库 MySQL
主备切换大揭秘:保证系统永不停机的秘密
本文由小米分享,介绍了分布式系统中的主备切换机制,旨在确保高可用性和可靠性。内容涵盖热备和冷备的概念,以及MySQL和Redis的主从复制原理和配置方法。通过主从复制,当主服务器故障时,备服务器能接管工作,维持服务连续性。文章还讨论了主备切换的挑战,如数据一致性与切换延迟,并提出了相应的解决方案。最后,作者鼓励读者就该主题提出疑问和建议。
336 4
|
缓存 JSON 运维
如何避免大规模线上故障
如何避免大规模线上故障
174 0
|
6月前
|
SQL 缓存 Java
如何做好大促时的系统高可用
如何在大促中做好系统高可用是大家都非常关心的一个问题,特别是在双十一之前,在大促过程中做好系统高可用保障是有双十一大促的客户都会了解的一个内容。大流量、系统内部/下游不稳定、单机故障、热点请求等等一系列的问题都会导致一些非预期的情况。那么今天就围绕大促来谈谈,如何在非预期的情况下,始终保持我们的系统...
如何做好大促时的系统高可用
|
JSON 运维 网络协议
平稳运行半年的系统宕机了,记录一次排错调优的全过程!
最近发生了一件很让人头疼的事情,已经上线半年且平稳运行半年系统在年后早高峰的使用时发生了濒临宕机的情况。访问速度特别慢,后台查到大量time_wait的连接,从代码层面到架构层面到网络层面排查了几天几夜,总算是有了结果。
|
数据采集 移动开发 监控
两把利器,轻松做好十一期间服务器监控保障
由于服务器需要7×24 小时运行,十一期间,为了切实做好服务器的重点保障,电源监控,必不可少。基于成本的考虑,我们决定自己做。如何多快好省,实现一个这样的平台呢?思路是通过服务器自带的远程管理模块读取redfish接口中电源功耗信息,然后采集到时间序列数据库,再通过grafana基于时间和ip做条件筛选做展示。这里就要用到两把开源利器Grafana和Influxdb。
两把利器,轻松做好十一期间服务器监控保障
|
运维 监控 前端开发
开发人员该如何应对线上故障
开发人员该如何应对线上故障
467 0
开发人员该如何应对线上故障
|
存储 SQL 运维