数据中心模块化和标准化(5-5)-阿里云开发者社区

开发者社区> AlibabaInfrastructure> 正文

数据中心模块化和标准化(5-5)

简介: 本文不代表本人所在公司的任何观点和看法;论述针对技术和科学本身,不针对任何公司的技术或产品;更多是提出问题并给出思考推导过程。

个人声明:本文引用图片为网络公开材料的图片或笔者自行创作图,尽量从个人专业角度解释一些人们本该了解并一直没弄清楚技术本质,不代表本人所在公司的任何观点和看法;论述针对技术和科学本身,不针对任何公司的技术或产品;更多是提出问题并给出思考推导过程,希望读者一同思考以下问题:

1) 模块化的概念如何定义?怎样判断是否模块化?

2) 产业链什么利益者推动着模块化数据中心前进?背后的驱动力?市面上宣传各种模块化优势,例如快速部署和降低PUE是否真实,用户应该怎么判别和选择?

3) 国内市场微模块成为关注点,到底怎么回事?用户是否必须部署?

4) 有各种的模块化方案可以实施,用户应该先做哪个,找谁做,怎么做?

8、解读数据中心标准化进程

(接上期文章)
比较完互联网数据中心的发展,大家会发现一个惊人相似时间路线图,先定制服务器,再基于定制服务器平台做IT模块标准化,IT模块标准化出来后,基本上匹配的大型机电设备就可以标准化,最后,建筑标准化更多是锦上添花了。如下图所示:

image.png

为什么是这个逻辑呢?在数据中心硬件设备里,服务器的成本占比基本上是最大的,互联网公司在业务实现的软件和系统架构上能力很强,选择适合自身业务特点的硬件设备而非通过外部咨询和设计实现是强需求,定制ICT设备就变得首当其冲。对于标准化了ICT设备后,离服务器关系最紧密的就是IT模块了,接着做机电模块标准化。大家可以看出,互联网公司都是一环扣一环的标准化,有套路的做。我们再看看国内领先的互联网公司做法,从4-5年前开始定制服务器到近两年整机架服务器计划,服务器的定制起步更早,而微模块/IT模块只是近2年的事情。所以国内互联网公司做法其实和国外互联网公司相比并没有本质差异,但数据中心的标准化程度以及系统设计乃至经验差距还是较大的。

至于企业是否实施微模块/IT模块,先看看自身是否有IT设备的技术掌控力和预判能力,然后看这个标准化的价值多少(价值公式),如果价值不大或者有限,其实并非关键路径。因为IT和网络设备是3-4年一个技术革新,基础设施能支撑10年左右。如果和ICT紧耦合,或许更新换代时候,微模块/IT模块就未必适用了。所以,笔者观点是做机电模块具有更多的适用性和经济性。微软的第五代DC架构、Ebay最新数据中心都用燃料电池+市电供电,无电池设计。借此例子笔者并非想讨论细致技术,仅想表达,技术革新可以发生在靠近IT端,也可以发生在远离IT端。如果机电设备要支持未来ICT的架构,不妨做资源池化,电力池,冷量池,按需切割才好匹配。而靠近IT端的IT模块/微模块,由于处于ICT变革和机电设备变革的交汇处,任何变革来临时,都会使得这些IT/微模块变得难以适应。一个有趣的例子,为什么谷歌会做了集装箱IT模块之后又放弃?是不够快速部署?不够便宜还是?笔者认为这些都并不正确,机电设备的变革和ICT设备变革,中间的IT模块架构会变得难以适应两边的变化,最终要用另外一种IT模块架构代替。如果大家有兴趣分析一下Facebook、谷歌、微软、Yandex,雅虎等现有方案,基本都是母线、大冷池、共享冷热通道等设计方案,在这方面的优化设计非常成熟,大家就能理解笔者所说的话。

接下来,笔者再回头解答第七章剩下的三个问题:

1)问:为什么谷歌、微软、Facebook、雅虎的数据中心模块化设计和思路都不一样呢?难道是他们自己故意不一样么?

答:笔者认为,因为这些公司定制的IT服务器路线选择不一样,很大程度影响数据中心设计的思路。虽然他们都是以TCO更低,可用性和灵活性更高发展,但关键TCO数据和具体设计这几个公司之间是不会或难以分享的,这种信息不足就变得无从比较和对齐各家思路。例如谷歌和微软、Facebook做服务器电源PSU的套路就不一致,制冷系统设计也不一致。这样下来,虽然各家的标准化程度都很高,但技术路线选择不一样,他们内部也不清楚别人TCO如何,至于多少收益,那就是冷暖自知了。

2)问:如果实施模块化数据中心时候,怎样才知道能判断模块化的层次更大?

答:使用标准化进程的表格进行分析就能判断。笔者认为,没有对ICT设备的技术掌控力,定制能力,基本上IT模块的标准化有一定意义,但总体并不大。微模块/IT模块,能够解决的问题只是非常少的一部分,可以说都不是数据中心基础设施关键点和难点,所以对于普通数据中心,大型机电系统的标准化设计和预制才是关键难点。因此应该以机电模块是否标准化作为衡量的关键点。

3)问:如果实施模块化数据中心,数据中心有那么多东西,我该从哪个系统做起,为什么要先做这个模块?怎么一步步做到类似国际同行先进水平?

答:笔者认为,前面已经解释了较多,原则上收益越大,难度越低就做哪个。如果是互联网公司,可以参考国外互联网的做法,不过需要推演自己的IT系统架构和DC的关联方案;如果是Colo公司和其他企业,要么狠抓IT走互联网公司路线,要么狠抓机电,走DRT路线。

本章结束前,笔者再点评一下一些市场上宣传,结合方法论解释一些宣传口号背后的本质:

1) “微模块”真的是快速交付吗?如果我要快速交付IDC,应该怎么办?

笔者认为,对于快速交付来说,根据标准化进程,应该做到各个层面的标准化然后交付速度才快。而“微模块”目前只是对非常小的一部分小型机电设备的设计标准化,对整体交付改善不够。我们不妨看看一个典型IDC的交付流程:

image.png

图22 典型IDC交付流程

如果微模块的标准化设计,可能占整个IDC设计的5~10%,剩下90~95%依然还要设计。假设标准化进程都很高情况下,快速交付将会如何?标准化设计和标准化预制都做好了,设计图做到90%(基本不用改,稍微针对项目调整),原来串联的进程变成并联进行,预制化简化生产、测试、建设、调试流程。具体快速交付有多快就取决于标准化程度高低了。如下图所示:

image.png

图23 标准预制化IDC交付流程

我们可以举一个日常生活例子——煮面条。在没有标准化(设计和预制)的情况下,煮面条需要有原料,配料、时间、手法(取决于个人能力),最后味道肯定也是取决于个人能力。如果只做了标准化设计,相当于有菜谱,这时结果肯定比没标准化单纯靠个人能力更好,时间也会缩短,但能好多少,在实际手法等还得靠个人能力。基于标准化设计,再做了标准化预制,相当于进一步变成了方便面+酱料包,这时质量结果一定大大提升,时间也大大减少(所谓交付时间减少)。这就是标准化设计和标准化预制后的结果。大家耳熟能详的快餐店,麦当劳,肯德基,真功夫,其实道理是一样的。这个例子同时还能解释一个问题,为什么日本方便面普遍比国内方便面更好吃,原因是标准化水平高低取决于系统设计。

笔者再用一个更加贴近行业的例子——PC电脑。在DIY时代,配置清单相当于标准化设计,而DIY电脑相当于工程。这时候对于用户来说,整个过程包含设计配置清单——选择部件和品牌——组装电脑——安装软件四个步骤,类似设计——选型——工程——调试。但是当固化配置清单的时候,相当于进行了标准化设计。而进一步进行预制,就是变成品牌机,下图以笔记本电脑为图例。同时大家也会发现,标准化预制A和B,差异较大,但很多人会选择标准化预制B(苹果电脑),因为性能,外观,电池续航,散热,重量等等因素,说明同样是标准化预制,两者的性能、外观等水平的差异是因为系统设计更优的原因。

image.png

2)使用“微模块”技术,PUE可以降低20%;

笔者认为,很重要一点,PUE的耗电大头在制冷系统、第二大头是电气系统。根据模块化的四要素里面,TCO关键点是系统设计。应先关注系统设计是否最优,再确认设备容量,这些才是PUE降低的关键。是否“微模块”并不重要也没关系,因为这更多是组合方式和平面布局,关键是系统设计和设备容量两个要素是否已经考虑清楚。当考虑清楚的时候,也许你会发现,不是考虑“微模块”PUE降低多少的问题,而是同样成本投入,怎么做模块化能降PUE更多的问题。

3)“x模块”最难做是什么?

笔者认为,简单的道理,一个东西的弱点是由最短板决定,弱点就是难点。无论做各种模块,最难的地方是接口最不清晰,部件最不标准。以“微模块”举例说明,其中模块化UPS、列间空调、机架等都是标准产品,电气和制冷的接口不多且标准(例如xx 安培单相/三相开关,DNxx的冷冻水管),反观通道密闭这个物理结构件是不标准的,还有监控设备的接口也不标准,所以这就是最难点。再举一个现实的例子说明,美国SuperNap数据中心,花了很多时间做了一个通道密闭,作为一个IT模块的核心关键,其实Facebook和SuperNap的做法本质上是一致的。下面两张图大家可以比较,上图为SuperNap,下图为Facebook:

image.png

图24 SuperNap数据中心

image.png

图25 Facebook数据中心

本章节结束,读者们应该清楚明白整个模块化和标准化的逻辑关系,怎么看待各种模块化,怎么利用模块化四要素方法论,价值公式,标准化进程三大方法论来解释各种业界模块化现象。

9、大型、中小型用户一些选择建议

回顾一下标准化进程,如果中小型用户没有IT、机电的人员,缺乏技术掌控力,那么就选择外包,可以用云计算、可以用Colo租赁,具体看自身能力和战略;中小型公司应该认真思考IT战略和数据中心部署跟自身业务的关系,考虑自建或外包。

大型用户,如果想数据中心更有竞争力和更好,需要提高IT和机电控制力,可以参考标准化进程来改进自身数据中心的模块化程度。没有IT掌控力,应该更关注到如何标准化机电模块上。如果想更好设计机电系统,建议找国外有经验设计院相关咨询,如果考虑成本原因,可以通过国外咨询设计院做技术咨询和概念设计,后续详细施工设计由国内设计院落地完成解决。

小结

本文系统的介绍了三大方法论,分别是:

1)模块化四要素分析法

2)价值公式;

3)数据中心标准化进程;

笔者旨在告诉大家模块化背后的各种方法论,协助业界同仁更好地辩证解读表象背后的技术本质,梳理大家的思路。授之以渔而非授之以鱼,模块化应该更关注其实现的功能和价值,并非关注形式。希望业界能够理清发展的趋势,朝更先进的数据中心道路发展,可以和国际同行在技术和理念上比肩。

(全文完)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:

阿里基础设施事业群,隐身于你接触到的阿里集团的各种服务和应用中。我们将在这个平台上与大家交流技术及IT行业的各种问题。

官网链接