现网问题复盘

简介: 现网问题复盘

大家好,我是阿萨。


最近阿萨遇到了一个问题,该问题再定位和对外答复的过程中自己都没有做得很好。今天这篇文章是自我反思之后的一些总结。


一:问题现象


客户机器上一张图表和其他图表相比总是少最新一天的数据。


在测试环境无法复现,只有现网有。


发现是现网和本地环境环境只有时区不一致。


把本地环境时区调成和现网一样也无法复现问题。


二:最终根因


计算时间时忘记考虑夏令时和冬令时的切换。从11月5日计算时间少了一个小时,导致每天计算时间都比之前少一个小时。所以以凌晨0点作为一天开始的时间变成了前一天23点作为当天的开始。导致查询数据就少了最后一天的数据。


三:阿萨可以改进的地方


1. 所有和时间相关的问题都需要考虑冬令时和夏令时。


2. 再给别人讲解根因的时候,自己推演一遍,看是否逻辑清楚。最好用RCA的方法。


3. 谋定而后动。不要着急答复问题,先了解清楚。流程图,失效机理是否都清楚了。多问问,不要被别人牵着往前走。要有自己的看法和意见。


4. 当别人质疑自己的时候,要思考下这件事自己有哪些不足的地方可以改进的。不要情绪上头。错失一次自己进步的机会。


5. 没人无事给你找茬。是自己有需要改进的地方。去打开看这件事情对自己的启发。


6.练好英语很关键。非常关键。关键时刻不被人扼住脖子。


阿萨在职场要修炼得还有很多呀。自己立不住,所以别人才会很容易打倒你。加油,先自立。


相关文章
|
运维 监控 数据库
线上服务故障处理原则
墨菲定律 任何事情都没有表面看起来那么简单 所有事情的发展都会比你预计的时间长 会出错的事情总会出错 如果担心某个事情发生,那么它更有可能发生 墨菲定律暗示我们,如果担心某种情况会发生,那么它更有可能发生,久而久之就一定会发生。
2283 0
|
5月前
|
Prometheus 监控 Cloud Native
关于告警,要想做好,从这些方面着手
监控告警最应该关注的是哪些方面?告警收敛、告警聚合、告警降噪、排班、认领、升级、协同
79 1
|
存储 数据采集 运维
业务系统故障率居高不下:有哪些非常有效的治理大招?
业务系统故障率居高不下:有哪些非常有效的治理大招?
368 0
|
存储 运维 监控
SRE心里话:要求100%服务可用性就是老板的无知
SRE心里话:要求100%服务可用性就是老板的无知
|
存储 人工智能 安全
年年玩五福,五福质量保障怎么做?
阿里QA导读:集五福作为支付宝年度最大IP,怎么能够让用户丝滑地参与体验五福?下面从质量视角聊聊今年参与五福的一些想法,希望所说内容能对业界质量保障的同学有所启发和帮助。
304 0
年年玩五福,五福质量保障怎么做?
|
监控 JavaScript 安全
从几次事故引起的对项目质量保障的思考
从几次事故引起的对项目质量保障的思考
|
存储 运维 监控
如何做好线上服务质量保障
上述的内容只是一个引子,因为高可用和线上服务的稳定性有密切的关系。而软件测试或者说质量保障的工作范畴,不仅仅在测试环境,线上环境的服务质量保障,也是我们需要关注的重点。
如何做好线上服务质量保障
|
测试技术 UED
复盘归因,提高交付质量的秘诀
这个阶段包括原型图、PRD文档、交互设计、技术方案、测试用例等几项重要产出物,当然他们有一定的前后依赖关系。
复盘归因,提高交付质量的秘诀
|
信息无障碍
每个人都要会的复盘知识
复盘本来是围棋术语。指的是在对弈之后,棋手们会重演一遍对局,从中发现自己的错误,理解对手的思路,研究更为妥善的走法。很多围棋高手都把复盘当做棋艺精进的重要法门。后来柳传志先生把复盘引入了管理领域。
201 0
每个人都要会的复盘知识
|
域名解析 监控 网络协议
线上故障实录-一大早服务就不可用了?
难得一个周末,一大早还没有睡醒就接到另外一个团队的电话,app 打不开了,所有的数据都没有了,睡意全无,赶紧起来看能不能紧急抢救一下,最终发现是一个关键链路的 nginx 配置错误,导致 nginx 无法启动,接下来完整的记录下愉快的周末中,这个不愉快的早晨
207 0
线上故障实录-一大早服务就不可用了?