本节书摘来华章计算机《vSphere性能设计:性能密集场景下CPU、内存、存储及网络的最佳设计实践》一书中的第3章 ,第3.1.2节,[美] 克里斯托弗·库塞克(Christopher Kusek) 著 吕南德特·施皮斯(Rynardt Spies)姚海鹏 刘韵洁 译, 更多章节内容可以访问云栖社区华章计算机”公众号查看。
3.1.2 测试新的应用和补丁
没有管理员会百分百确定地说:“我们部署了主机入侵防御系统(HIPS),并在周二打了最新的补丁,一切都工作得很好。”而测试实验室可以让你更加有信心地说出这句话。从表面上看,你可能会觉得测试实验室是测试安装新应用程序或补丁的,但是实际上,根据你所建立的实验室的精确程度,它的作用远不止于此。我们需要重点强调生产环境与测试实验室环境相同。这将使你可以对一些非常容易忽略但又非常重要的基础设施应用补丁:
- 存储阵列和新的补丁程序或新版本代码;
- 光纤通道或FCoE交换机更新;
- 网络交换机、操作系统的更新和修丁;
- 服务器固件、ESXi更新和安全补丁;
- 光纤通道、硬件iSCSI和CNA固件。
我们已经记不清有多少次因为在投入生产前没有在测试实验室中测试一些微小的变化而导致系统停机,进而造成连续多日严重的系统中断。在生产之前进行测试并打上相应的补丁会很有帮助。无论它们是物理设施还是应用级的补丁,你都会有一个参考点,然后通过适当的试运行,让你可以放心地将它们投入生产之中。
但对于新应用的测试和部署会怎样呢?难道我们能只是因为它们可能会正常运行就把这些直接投入生产中吗?历史已经证明,“可能”往往会导致严重的事件发生,所以你最好小心谨慎,在部署前进行测试。我们之前提到HIPS,如果不经测试和检查,它将会是一个十足的破坏程序。其他类似的应用程序可能是一些新的管理、监控和第三方工具,如果你不知道它们会有什么影响,那么你绝不应该把它们投入生产中。
有些工具会直接与VMkernel进行交互,在ESXi Shells中运行代码甚至其他功能。测试它能否被正常地使用、安装、删除等,这将为你之后的工作节省大量的时间。尤其你不想向管理者解释:环境崩溃是由部署到生产环境中一个未检查和未测试的应用程序造成的。