2013年6月13日晚10点左右,一场暴风雨(突发的非正常流量)突袭园子,造成满园尽是500。
这次风暴给大家带来了麻烦,恳请大家的谅解!在这篇博文中,我们向大家汇报一下暴风雨的袭击过程。
当发现问题后,我们立即登录上云服务器发现巨量的请求扑向云服务器,将云服务器的CPU撑爆,奇怪的是这些请求访问的竟然不是我们的域名。
原来是有人将域名解析到了我们的IP,针对这个域名的大量请求全部转向了我们的Web服务器,暴风雨就是这么来的。
虽然我们在程序中会对这种情况(请求的域名不匹配)直接返回404错误,但这次请求量太大,云服务器的CPU撑不住,从而引发了500错误。
*思考:
- 如果阿里云能提供云服务器的CPU占用报警功能,就能更及时地发现这种异常情况。
- 如果阿里云能实现真正的计算能力弹性扩展,就能在CPU跑满的情况下自动增加CPU,减少突增请求对网站正常访问的影响。如果按照现在的方式,发现CPU不够用的时候再购买云服务器、配置、部署,黄花菜都凉了。
- 在非常高并发的情况下,托管代码还是有些力不从心,证据来自——我们后来用非托管的IIS URL Rewrite Module解决了问题。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。