摘要:在 @Scale 年度会议上,Facebook 工程副总裁 Jay Parikh 说,拆散一个数据中心比将其重新组装起来更容易,而该公司 SWAT(代表灾难特种武器和战术团队) 团队执行的定期压力测试正让该公司软件工程师在重新组装这部分变得更好。
Jay Parikh将这项工作称为 Project Storm,始于2012年的 Sandy 飓风,Sandy 飓风威胁到了2个Facebook数据中心,虽然最终飓风没有对数据中心造成损害,但这一事件促使该公司的工程团队考虑突然损失一个或多个数据中心的情况下Facebook全球服务受到的影响。
该公司召集了一个SWAT团队去寻找答案。2014年, Project Storm进行了一项真实世界的测试:干掉一个数据中心观察流量是否能顺利转移。
本文转自d1net(转载)