《数据中心设计与运营实战》——第1章 介绍1.1 仓储式数据中心

简介:

本节书摘来自异步社区《数据中心设计与运营实战》一书中的第1章,第1.1节,作者: 【美】Luiz André Barroso , 【美】Jimmy Clidaras , 【瑞士】Urs Hölzle 更多章节内容可以访问云栖社区“异步社区”公众号查看。

第1章 介绍

ARPANET问世已经超过40年了,World Wide Web最近刚刚庆祝完其走过了20周年。被这两个有杰出意义的里程碑所引领的互联网技术继续改变着各行各业和现今人们的生活习惯,时至今日依然势头不减。诸如网页邮箱、搜索、社交网络等流行互联网服务的出现,加之高速互联网络在世界各地的普及,使互联网服务日渐呈现出向服务器端以及云端转移的趋势。

越来越多的计算和存储需求开始从类PC客户端向更小、更适合移动设备,并结合了大型互联网服务的方向迁移。早期的互联网服务大多是用来提供资讯,而今许多Web应用提供了以前客户端承载的服务,例如电子邮件、照片、视频存储和办公应用。驱动这种计算向服务器端转移的不仅是提升用户体验的需求,诸如无需配置或备份的便捷管理和无缝接入,软件供应商自身可以从中受益也是一个重要的驱动力。软件即服务允许更快的应用开发节奏,因为它使得供应商可以更快捷地改变和提升软件。供应商无需维护拥有特定硬件和软件配置的数以百万计的客户端,他们只需在自己的数据中心里就可以完成协同改进和修复,并且能够让他们的硬件以最佳配置部署。

此外,数据中心的经济性使许多应用服务降低了单用户成本。例如,服务器可能会为成千上万的活跃用户和更多不活跃用户提供服务共享。同样的,计算自身也可以通过共享服务来降低成本,例如,对于一个收件人为多个用户的电子邮件附件,仅需存储一次,而不是多次。最后,放置在数据中心的服务器和存储设备比同等规模的台式机或笔记本电脑更容易管理,因为它们由单一组织进行管理。

有些工作负载需要强大的计算能力,大规模计算集群显然比客户端计算更适合用于这种情况。搜索服务(网页、图片等)是此类工作负载的最好案例。但是对于诸如语言翻译类应用而言,大规模集群计算依然更有效率,因为翻译依赖于对大规模语言模型的分析。

计算向服务器端转移的趋势和互联网服务的爆炸式流行创造了一类新的计算系统,我们将其命名为仓储式数据中心,即WSC(Warehouse- Scale Computer)。这样命名是为了突出这些机器最显著的特点:拥有适应大规模基础架构的软件、数据仓库和硬件平台。这种系统使人们对计算技术沿袭多年的“单一程序运行在单一机器上”的这一认知成为历史。在WSC中,程序被定义为一个可能包括由数十个甚至更多独立程序交互实现的复杂用户服务,诸如电子邮件、搜索和地图。这些独立程序可能由不同的甚至跨越组织、地域和公司的工程师团队部署和维护,例如Mashups(利用外部数据源检索到的内容来创建全新的服务的工具)。

运行大规模服务所需的计算平台已经不再是十多年前的那种一个比萨饼盒大小的服务器或者冰箱大小的高端多处理器系统了。这样一个平台的硬件由成千上万的独立计算节点,和与之对应的网络和存储子系统、配电、空调设备和巨大的冷却系统组成。这些系统所在的建筑也已经成为系统的一部分,和一个大型仓库没有什么区别。

1.1 仓储式数据中心

这些系统的显著特点在于规模,我们可以简单地称之为数据中心。数据中心是部署了许多服务器和通信设备的专用建筑物,因为这些服务器和通信设备具有相同的环境和物理安全要求,并且需要易于维护。从这个意义上讲,WSC是数据中心的一种类型。然而,传统数据中心通常在主机上大量运行着相对小型或中型的应用,每一个程序运行在一个专用的硬件基础设施上且高度耦合,并且在相同基础设施中进行隔离保护。这些数据中心为不同组织和公司提供硬件和软件服务,存在于这种数据中心里的不同计算系统在硬件、软件,或维护上几乎没有相同之处,而且彼此之间趋向于没有通信。

为诸如Google、Amazon、Facebook和Microsoft的在线服务部门提供服务的WSC数据中心,明显区别于传统数据中心:它们属于一个组织,使用互相兼容的硬件和系统软件平台,共享一个系统管理层。通常,相比采用第三方软件运行的传统数据中心,大多数应用、中间件和系统软件都是组织内部编写的。更重要的是,WSC运行着数量少但规模大的应用(或者互联网服务),且通用的资源管理基础架构带来了巨大的部署灵活性1。同质性的要求,单一组织控制和对成本有效性的增长的关注都激励着设计师们采取新的方法来建设和运营这些系统。

互联网服务必须做到高可用,典型目标是至少99.99%的正常运行时间(大约每年有一小时停机时间)。实现在大量软硬件和系统软件上无故障运行是相当困难的,而引入大量服务器将使其变得更加困难,虽然理论上在10000台服务器的集合中防止硬件故障是可能的,但成本极高。因此,WSC必须被设计成能够进行大量组件容错,使之极少甚至不影响服务级别的性能和可用性。

相关文章
|
消息中间件 存储 负载均衡
多数据中心的百万级消息服务实战
多数据中心的百万级消息服务实战
254 0
多数据中心的百万级消息服务实战
|
存储 安全 数据库
云计算将如何改变数据中心运营与发展
如今,信息技术一直在不断发展。而这种技术进步继续以极快的速度发生,需要更快的处理和大量的数据存储,而在过去二十年中引入了改变数据中心设计和部署的云计算模型。
177 0
云计算将如何改变数据中心运营与发展
|
达摩院 大数据 数据中心
阿里巴巴浙江云计算仁和数据中心正式运营
9月16日,全球规模最大的全浸没式液冷数据中心——阿里巴巴浙江云计算仁和数据中心正式投入运营,它也是我国首座绿色等级达5A级的液冷数据中心。作为阿里巴巴在浙江省杭州市的首座超级云计算数据中心,仁和数据中心将有效辐射长三角经济带,为新基建注入强动力。浙江省发改委副主任胡奎、杭州市委常委、余杭区委书记张振丰、阿里云智能总裁张建锋出席当天的开服仪式并致辞。
阿里巴巴浙江云计算仁和数据中心正式运营
下一篇
无影云桌面