维持数据服务系统稳定运行的三架马车

简介:

最近对影响系统稳定性运行的历史事件做了分析,可分为三类,解决不好就是三大杀手,解决好了就是三架马车。

一、数据源故障传导

如果说数据服务系统的数据是蛋糕,那么数据源系统就是在提供面粉和鸡蛋。面粉或者鸡蛋没来,蛋糕自然也就吃不上了。这个原因大约占50%。

二、人为因素

频繁变更、心情不佳、习惯不良、工作被打断,都会提高出错的可能性,大约占30%。

三、平台

操作人员误操作、程序没写好,都是挑战平台的健壮性的。虽然也可以归为人为因素,但是如果平台做得更好一些,问题可以规避。这一类问题,加上系统宕机、监控不当一类的问题,我都归结为平台因素,大约占20%。

总结:数据服务体系上下游延伸的链条很长,任何一个环节出现问题都有可能造成用户体验到系统不稳定的结果。又因为链条很长,所以导致系统不稳定的原因会千奇百怪,仅仅是发现一个解决一个是很难控制住的。表面上看人为因素也就是1/3,但是深度思考下去,数据源头和平台的背后也是人,归根到底还是“人性”占主要。这就需要有一名好的管理者,做好上下游沟通、控制好工作的节奏、为员工营造良好的工作氛围,人好了,系统也就跟着好了。




 本文转自 hexiaini235 51CTO博客,原文链接:http://blog.51cto.com/idata/1082351,如需转载请自行联系原作者


相关文章
|
JavaScript 前端开发 API
基于Vue和Element UI实现前后端分离和交互
基于Vue和Element UI实现前后端分离和交互
767 1
|
Docker 容器
docker 强制删除镜像
docker 强制删除镜像
|
存储 Java 编译器
Java中的关系运算符详解
Java中的关系运算符详解
234 1
|
存储 索引 Python
Python笔记相关(上)
Python笔记相关
123 0
|
人工智能 数据可视化 Scala
在PyCharm中使用Jupyter进行人工智能学习开发经验介绍
在PyCharm中使用Jupyter进行人工智能学习开发经验介绍
736 0
|
存储 人工智能 定位技术
AI Earth谷谷gis里面下载的tif文件导入不进去
AI Earth谷谷gis里面下载的tif文件导入不进去
335 2
|
存储 Prometheus 监控
在微服务架构下基于 Prometheus 构建一体化监控平台的最佳实践
个人认为将来可观测性一定是标准化且由开源驱动的。现在整个软件架构体系变得越来越复杂,我们要监控的对象越来越多,场景也越来越广。封闭的单一厂商很难面面俱到的去实现全局可观测能力,需要社区生态共同参与,用开放、标准的方法来构建云原生可观测性。
891 0
在微服务架构下基于 Prometheus 构建一体化监控平台的最佳实践
|
安全 Linux 网络架构
kali_NAT模式、桥接上网/仅主机_详细
kali_NAT模式、桥接上网/仅主机_详细
kali_NAT模式、桥接上网/仅主机_详细
|
存储 移动开发 运维
python3入门笔记 上
python3入门笔记 上
155 0