一个事故引发的思考

简介:

今天线上服务出现了一个事故,思考下这个事故,觉得有好几个地方需要思考。

1 对于前端而言,代码回滚的功能是必须的。前端接口出现了问题,第一个应该想到的是将代码回滚到一个稳定版本。

2 缓存和数据库的使用,需要注意一个问题,当缓存失效的时候,可能会有大并发的请求去访问数据库,这个时候数据库会不会崩溃?如果这个时候数据库崩溃了,那么web前段机也会随之崩溃。

所以,缓存失效的时候去数据库访问这里必须有一个锁机制。

3 在处理缓存和数据库的关系的时候,缓存一般会去设置一个过期时间,是在这个过期时间到的时候,缓存中的数据自动删除呢?还是做伪过期?即在设置的时候单独设置一个expire过期时间,根据这个过期时间来判断是否过期,这个好处是这里的缓存中得数据除了做加速作用,还做了容灾处理,当后端数据库挂了的时候,缓存中的数据就会一直生效。

4 设置过期时间的时候是否需要将过期时间散列,这个是个技巧。

5 客户端不要做在XX点做接口调用的操作。这完全就相当于DDOS攻击了。客户端需要将所有接口做散列处理。不能集中。

6 报警和预警机制需要考虑。

7 再高深的技术不如让服务稳定最重要。

8 在做第三方请求处理的时候,需要问下自己,如果这个请求失败了怎么办?




本文转自轩脉刃博客园博客,原文链接:http://www.cnblogs.com/yjf512/p/3483038.html,如需转载请自行联系原作者


相关文章
|
6月前
|
运维 前端开发 JavaScript
年底事故频发,做前端会不会出大型事故?
年底事故频发,做前端会不会出大型事故?
55 0
|
存储 安全 网络安全
如何避免严重网络安全事故的发生?
本文汇总了一些企业组织可能面对的重大网络安全事故,并给出了相应的防护政策,希望能够为企业组织提供更具有针对性的安全防护经验知识,以备不时之需。
537 0
|
传感器 安全 物联网
五种常见的智能工厂安全风险以及如何补救它们
维护组织、客户和员工的数据安全是一项挑战。智能技术带来了帮助流程更平稳运行的功能。然而,如果没有正确的安全措施,所有收集的数据都是无用的。下面,您将发现五种常见的安全风险以及如何补救它们。
514 0
五种常见的智能工厂安全风险以及如何补救它们