Facebook血拼压力测试:“拆毁”数据中心看影响

简介:

网站很担心意外导致的服务中断事故,社交网络巨头Facebook也不例外。不过脸书倒是敢于直面惨淡的事故,主动采取“毁掉”数据中心的方式来演练事故应对和处理,定期进行真实的事故压力测试。

image

在该公司Scale年度会议上,工程副总裁Jay Parikh表示,拆散一个数据中心比将其重新组装起来更容易,而该公司SWAT(Special Weapons And Tactics,特殊武器与战术)团队执行的定期压力测试正在让该公司软件工程师在数据中心重组方面分变得更优秀。

Parikh将这项工作称为Project Storm,它始于2012年的Sandy飓风。该飓风威胁到了2个Facebook数据中心,虽然飓风并没有对数据中心造成损害,但这一事件促使该公司的工程团队开始思考在突然损失一个或多个数据中心的情况下,Facebook全球服务可能会受到怎样的影响,该公司因此召集了一个SWAT团队去寻找答案。

从2014年,Project Storm进行了一项真实世界的测试:干掉一个数据中心观察流量是否能顺利转移。经过多次测试,Facebook均能够应对单个数据中心下线的问题。目前该压力测试项目依然在进行中。

本文转自d1net(转载)

相关文章
|
4月前
|
机器学习/深度学习 敏捷开发 测试技术
深入理解自动化测试:框架选择与实践挑战利用机器学习技术优化数据中心冷却系统
【5月更文挑战第27天】 在现代软件开发周期中,自动化测试已成为确保产品质量和加快市场投放的关键步骤。本文深入探讨了自动化测试的框架选择问题,并剖析了实施过程中面临的挑战及其解决方案。通过比较不同测试框架的特点,我们旨在为读者提供一套明确的指导原则,帮助他们根据项目需求做出恰当的技术决策。同时,文中还分享了实际案例和最佳实践,以期帮助开发团队克服实施自动化测试时可能遇到的障碍。
「镁客早报」Facebook建太阳能发电厂为数据中心供电;马斯克概念验证隧道将面向公众开放
Facebook建太阳能发电厂为数据中心供电;苹果新款手机被迫砍单,富士康或将裁员。
329 0
|
Web App开发 人工智能 安全
云栖科技评论第21期:Facebook绿色数据中心提供空前的能源使用效率
本周热点科技事件,是阿里云“ET”采用分布式爬虫收集全球海量互联网信息,利用文本挖掘和语义分析解析新闻关键词,使用深度神经网络将新闻分类,汇总而选择最新鲜的科技信息。 编辑制作:人民网研究院 内容提供:阿里云研究中心
961 0
|
SQL NoSQL 测试技术
互联网模式下的测试数据中心,小白也能高效构造数据
11月2日,云效第三期Work Like Alibaba系列直播开启,阿里巴巴研发效能事业部云效技术专家何卫龙,分享了《测试数据中心-互联网模式下新型的数据准备引擎》,主要解决测试过程中数据准备困难,以及如何提升数据准备效率的思路和方法。
6419 0
|
机器学习/深度学习 存储 人工智能