阿里云Optane+QLC存储实践案例分享-阿里云开发者社区

阿里云Optane+QLC存储实践案例分享

2022-11-19 294

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文主要分享主题在阿里云本地盘存储中，基于Optane SSD和SPDK WSR的功能，降低QLC SSD的写放大。

作者简介：周雁波，阿里云资深云储研发工程师，曾就职Intel参与spdk软件研发工作，《Linux开源存储全栈详解：从Ceph到容器存储》作者之一。

本文主要分享主题在阿里云本地盘存储中，基于Optane SSD和SPDK WSR的功能，降低QLC SSD的写放大。

本地盘是ECS实例所在物理机上的本地硬盘设备。本地盘能够为ECS实例提供本地存储访问能力，具有低时延、高随机IOPS、高吞吐量和高性价比的优势。

在本地盘会提供两种规格的产品：

在云存储的演进过程中，有几个阶段：

写放大是NAND-based SSD中最让人头疼的因素。主要的根源是操作粒度之间的差异：

SSD IU(Indriection Unit, 盘内部物理的访问的大小)比用户操作数据块要大。Intel QLC SSD有16K IU和64K IU两个代次。
SSD擦除的数据块大小比应用层的数据块也要大。

写放大会影响性能和寿命，比如下图，随机写IOPS性能会不断的下降直到一个稳态，此时盘内部的写放大会达到最大。写放大如果太大的话，也会降低SSD的寿命，加速盘的老化。

下图中，采用50%混合随机读场景比100%纯随机读场景的延迟要高出一个量级，这里面的原因也主要是GC和写放大对延迟的影响。

为了解决写放大对QLC SSD性能和寿命的影响，我们采用了基于Optane SSD的缓存和分层存储架构。Optane SSD的优势是高读写性能，高可靠性/耐久性，同时没有类似NAND-SSD因为复写而带来的写放大的影响。作为缓存层是非常理想的选择。

在写过程的IO传输路径中，IO会写到本地盘虚拟块设备中，然后优先落盘到Optane SSD，完成写入响应后，再从Optane SSD中通过聚合/压缩等算法，形成大块顺序写场景，把数据下刷到QLC SSD中，降低写放大。

传统的cache缓存改进基于bcache，OCF，对NAND不是很友好的写入。在Optane下刷过程，也不是SSD IU对齐的IO pattern。
基于WSR(Write-Shaping RAID)的写入对NAND非常友好，大块写且顺序，同时与SSD IU对齐。这样实现的方式从软件上做了彻底的优化，降低写放大。