超大规模云数据中心对存储的诉求有哪些？

2022-11-19 328

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 要实现超大规模部署的特性，就对存储有别于普通数据中心或者消费市场的诉求。具体有哪些呢？主要有以下几点，我们针对部分信息展开讨论

超大规模的数据中心，核心在于实现大规模的分布式存储计算，具有高性能、高吞吐、高冗余、高可靠性的特性，一般情况下，规模超过5000台服务器，就可以算是超大规模集群了，通常应用在云计算场景。

因为要实现超大规模部署的特性，就对存储有别于普通数据中心或者消费市场的诉求。具体有哪些呢？主要有以下几点，我们针对部分信息展开讨论下：

超大规模且具备弹性
大容量、低成本
功耗、散热效率
热插拔可维护能力
峰值性能、单TB的性能优势以及稳定的QoS性能
安全性
向后兼容
完整的远程debug分析能力

第一点：M.2接口正在逐渐远离数据中心

在存储领域，M.2固态硬盘支持NVME/PCIe和SATA两类协议。PCIe SSD其实都是NVMe over PCIe；SATA SSD，则是AHCI over SATA.

在M.2接口细分两个规格，Socket2和Socket3。Socket 2支持SATA和PCIe X2接口SSD。Socket 3可以支持PCIe x4接口。虽然长得很像，但是大有乾坤，如下图左，是M.2 SATA接口SSD的模样，下图右则是M.2PCIe 接口SSD的模样。

目前M.2根据尺寸的不同也可以分为大概4类，不过容量最大只支持8T容量。而且还不支持热插拔。

更多M.2接口尺寸如下图，供参考。

M.2接口的金手指接口，比较容易出现划伤，出现接触相关的链路异常。

M.2接口最大的功耗也有限制，不能超过8.25W。M.2目前在数据中心主要用于boot ssd，系统启动盘。CPU不断的迭代和性能提升，很多CPU目前已经去掉了链接SATA盘的接口，也导致M.2 SATA SSD作为启动盘就需要中间增加PCIe转SATA控制器，这就意味着成本的增加。此外，Boot盘的容量也在缓慢上升。

为解决M.2接口存在的热插拔、散热、过热以及容量扩展问题，业内目前找到的解决方案是采用E1.S接口。E1.S是一个小尺寸，比M.2长一点，但更宽，可以容纳更多的NAND Die，实现容量的叠加，具有更强的扩展性。最新版本的E1.S提供了一个新的可选对称外壳，宽度为9.5毫米 (类似于E1.L)，可根据需要提供高达20w和x8 PCIe的可扩展性。主流ssd仍有望仅是PCIe x4，但尺寸上的PCIe x8支持允许使用其他需要更高带宽的设备。