背景
为了防止上线出现错误,我们的项目准备了A,B,两套环境。两套环境依次进行上线,如果上线出现问题的话,第一时间进行环境切换以免造成问题。但是初期的时候,使用两个环境的过程中由于人为的原因出现了很多问题。
1.生产环境A,没有及时进行构建
2.2022年5月1日发版日志没有关联需求
3.B环境构建异常,没有及时处理
4.线上运行的是B环境,实际应该运行A环境。
5.系统跑一段时间,内存占用随着时间增加而剧增,大约一周左右时间内存到达不可用。
改进
其实上文所述,前四个问题都是可以从流程上进行避免的。虽然人做事一定会出错,但是我们可以通过制度进行管理。
例如:上线流程清单
通过统一的流程清单,对整个过程做好管理,尽量避免发生上述所说问题。
总结
做事的时候,必须从全局出发,有了全局去指导微观才能避免出现低级错误。人+制度+机器,更好的管理我们的流程