PLC SSD虽来但远,QLC SSD火力全开

简介: PLC NAND的普及还需要一定的时日。乐观估计,PLC SSD最快也要到2025年才可能量产进入市场。所以,PLC SSD还是一个未来的产品,当前我们的目光还是聚集在QLC身上吧。

引言

上一篇文章中,小编在最后有说“基于QLC NAND的ZNS SSD将是最大的赢家”:

也有同学在留言“为什么QLC会成为赢家?

本文就以这个话题继续一起聊聊QLC那些事儿~


PLC虽来但远

今年8月份在美国FMS峰会上,Solidigm公司(Intel出售NAND SSD产品线给韩国海力士后新成立的公司)向外界展示了全世界第一款基于PLC NAND研发的SSD。这也标志着,PLC时代已正式拉开序幕。

虽然PLC带着光环而来,但是PLC SSD要想普及,难度很大。古猫先生的观点是,在TLC时代,为了解决8-vt level的偏移,SSD控制器可以采用2K LDPC ECC,在QLC时代,为了解决16-vt level的偏移导致的错误,SSD控制器不得不引入更强大的4KB LDPC ECC纠错能力,配合更加智能的磨损均衡、OP冗余等FTL管理算法。

目前业内尚未有控制器公司对外宣称可以支持PLC NAND。市场上当前主流的SSD控制器主要都是基于ARM Cortex-R8 Core,提供4K LDPC ECC纠错能力。ARM公司在2020年发布的Cortex-R82 Core主要体现在实时计算,这点预计主要为SSD控制内部提供智能AI算法运行,让SSD更加智能化,也并不是为了PLC SSD。基于ARM Cortex-R82 Core的SSD控制器预计在2023年有正式量产的产品。

此外,PLC虽然带来的容量的上的收益,但是相应的工艺和匹配的技术复杂也更加严苛,最后带来的成本并不会很好看。

没有支持PLC NAND控制器的加持以及PLC技术的成本下降,PLC NAND的普及还需要一定的时日。乐观估计,PLC SSD最快也要到2025年才可能量产进入市场。

所以,PLC SSD还是一个未来的产品,当前我们的目光还是聚集在QLC身上吧。

QLC当打之年

根据有关数据统计,目前SSD出货的DWPD小于1的占比达到85%,这几年一直维持在85%-86%,后续可能会继续扩大占比。也就是说,这个市场上的对SSD的寿命的诉求并不是很强烈,不需要DWPD很高的SSD。这也侧面说明了,行业内已不再完全依赖SSD硬件本身的特性来实现整个系统的可靠性。分布式存储,全闪存阵列,各种针对SSD优化的存储软件系统也是遍地开花。这个也给了QLC SSD大规模普及提供了有力的条件。

我们在回顾下NAND的四个类型:SLC、MLC、TLC、QLC(这里我们就先不提PLC了,原因参考第一部分介绍)

SLC的Program/Erase(P/E) Cycle可以达到10万,MLC P/E cycle可以到1万,到TLC 3000次P/E cycle,再到QLC NAND只有1000 P/E cycle。P/E cycle是表征SSD寿命的最重要的参数。

我们可以看到,随着单个cell含有的bit数越多,NAND的可靠性也会有所降低,自然成本也会继续下降,QLC的成本只有SLC成本的1/4。除了寿命可靠性,QLC处于劣势,还有在性能方面也有所降低,如下图,QLC NAND单个page页的写延迟是SLC的8倍,是TLC的2倍,读延迟是SLC的4倍,是TLC的约1.3倍。

既然QLC可靠性和性能都比TLC差,那QLC还有什么用?是不是就可以放弃了?

实则不然,QLC的出现并不是为了取代SLC/MLC/TLC这些前辈,实力也不允许完成替代。QLC更是对TLC SSD的补充,让SSD市场更加的丰富多彩,QLC SSD最终的目标是为了取代HDD机械硬盘。机械硬盘给我们的印象就是又笨重又大的壳子,SSD更加的轻便。机械硬盘主要的使用场景是数据备份等存储需要,容量很大,随便都是8T起步,目前最大的更是达到20TB以上。而SSD目前最大的TLC基本只有8T,大多是1T/2T/4T,更小的还有256GB/512GB。QLC的容量相对要大,可以达到15TB以上。

随着容量的增加,在解决方案中还有一个因素需要考虑:IOPS/TB, 也就是单TB达到的IOPS性能。容量的增加,会让每TB获得的IOPS性能也相应的下降。QLC SSD如果要在容量增加的基础上,继续保持竞争力,IOPS也是非常关键的因素。对比不同协议接口SATA/SAS/PCIe可以清楚的发现,QLC SSD搭配PCIe协议接口才是当下最具竞争力的CP组合。

目前市场上QLC最强劲的应该属于Intel(现在是Solidigm)在2021年Q2发布的基于144L QLC 3D NAND研发的企业级QLC SSD P5316了。在消费级市场Slodigm也最新发布了同样基于144L QLC 3D NAND搭载台湾控制器厂商慧荣科技SM2269XT控制器,主要是M.2接口的。在PC电脑市场上,目前也有大量的QLC SSD,有sata协议,也有pcie协议的,市场红火。

本文主要考虑PCIe QLC企业级SSD的应用场景。

上面提到,QLC SSD的目标不是取代TLC,而是与HDD抢市场,让我们先对比下市场上几款比较强劲HDD/TLC/QLC SSD产品对比。

  • 顺序读:TLC/QLC完胜HDD,同时QLC和TLC持平,达到同样的性能水平
  • 随机读:TLC/QLC更是优势巨大,QLC比TLC稍微弱一点
  • 随机读写延迟:HDD基本在ms级别,TLC/QLC都在us级别,相差一个数量级,优势明显。但是QLC在随机性能方面比TLC要差很多,差距在10倍以上。

基于以上的性能数据对比,QLC SSD想要闯出一片属于自己的天空,不能正面硬刚,要选择自己擅长的领域。QLC在读方面与TLC的差异不大,因此QLC SSD的目标使用场景也主要是读为主的业务场景。TLC/QLC分别在block size块大小和读写分布的适用性,如下图总结。找准了自己的定位,QLC SSD就可以发挥自己的优势,带着梁静茹给的勇气向前出发了!


那么,适合QLC SSD读为主的应用场景都有哪些呢?我们来一起总结下:

为了更加清晰的理解,把这个总结按照IO数据分布图填充,就得到下面这张图,更加的直观。

QLC应用案例分析

我们这里分享一个QLC SSD在CDN加速场景应用的案例。首先看下CDN是什么。

CDN 是内容分发的网络拓扑结构,在源服务器(网站原始所在地)和节点(服务器集群,缓存源服务器的文件并提供加速服务)之间提供网络加速的功能。

  • 在没有开启CDN加速的情况下,当我们访问目标网站,会直接访问目标网站源服务器。这样就有一个缺陷,访问的距离越远,源服务器的响应就越慢。
  • 在开启CDN加速的情况下,当我们访问目标网站时,会第一优先级访问距离我们最新的节点。相当于提前把用户需要访问的文件传输到加速节点,用户就不需要等待源服务器的响应了,大大提升了用户的体验。


小编之前正好体验过CDN加速的快乐,事情是这样的,在代码开发中,我准备从官网下载VScode,但是开启下载后,发现速度真的是龟速啊,只有57KB/s, 5G的时代,还这么慢,简直不可接受。

后来发现,VScode官网有使用CDN加速功能,立即把下载链接中的域名替换成cdn加速域名(vscode.cdn.azure.cn),现在速率直接飙升至2.3MB/s。飞一样的感觉!

好像有点扯远了,见证了CDN加速的好处,我们还是回归正题。在CDN场景下,QLC如何发挥价值呢?

CDN真正影响用户体验就是离用户最近节点服务器以及中间传输节点服务器,这部分机器既要求有低延迟的服务,又要求存储数据。访问的数据模型主要是128KB以上的95%顺序读,还有5%的随机混合读写。

CDN之前的解决方案通常采用混合存储的方式:TLC SSD作为缓存+HDD作为数据存储。这样既可以满足低延迟的需求,又可以满足低成本的数据存储需求。如果采用全QLC替换TLC SSD+HDD的混合方案,收益如何?

以Intel P5316为例,全QLC SSD的替换后,单个服务器容量提升6倍,带宽提升3.7倍,功耗效率提升3.7倍,单个服务器容量的提升,也可以服务更多的用户,收益明显。

针对QLC,如果有任何想说的,欢迎留言或者私信交流,感谢支持!


相关文章
|
存储 弹性计算 架构师
云服务器基准性能测试
随着数字化的不断发展,企业 IT 上云早已是大势所趋,通常上云的第一步是选一款云服务器。然而云服务器的型号众多,如阿里云的云服务器规格就多达上百款(详见https://help.aliyun.com/document_detail/25378.html),因此在选择具体一款规格的云服务器时,通常需要对云服务器的性能做一个基准测试,然后再做一轮业务测试。本最佳实践适合利用标准的benchmark工具对云服务器的CPU、内存、网络和磁盘性能进行测试的场景。
1871 1
云服务器基准性能测试
|
JSON 自然语言处理 编译器
Alibaba.com瘦包40MB——业界最全的iOS包大小技术总结
前言包大小是衡量APP性能的一项重要指标,它直接影响用户的下载点击率(包太大不想下)、下载安装成功率(下载慢不用了)、APP卸载率(太占空间先删掉)。包大小的计算逻辑很简单,它是各种类型的文件占用磁盘大小相加。APP瘦身的技术却很复杂,代码文件的复杂度和编译器策略决定了可执行文件的大小,业务功能和工程架构决定了代码文件的复杂度。iOS APP瘦身,需要掌握的技能有XCode构建技术、LLVM编译器
4618 0
Alibaba.com瘦包40MB——业界最全的iOS包大小技术总结
|
算法 Java 测试技术
Java实现数据压缩所有方式性能测试
Java实现数据压缩所有方式性能测试
864 0
|
存储 Unix Linux
手写操作系统(4)——计算机是如何启动的?BIOS、GRUB、文件系统......
手写操作系统(4)——计算机是如何启动的?BIOS、GRUB、文件系统......
378 1
|
安全
猿大师办公助手在线编辑微软Office/金山wps网页组件COM加载项启用说明
猿大师办公助手是一款独特的在线编辑Office插件,不同于其他厂商的弹窗模式,它真正实现了网页内嵌本机Office。其COM加载项可在Office主菜单栏增加PageHi子菜单,提供文件保存、打印等功能,并能控制文档操作权限。安装后,默认自动启动COM加载项,但需注意可能被禁用或拦截,必要时需手动启用。对于WPS和微软Office,均有详细的启用步骤。
372 5
猿大师办公助手在线编辑微软Office/金山wps网页组件COM加载项启用说明
|
存储 调度 块存储
十二年磨一剑:三代架构演进,打造高性能、低成本的块存储!
上周,全球计算机存储顶会USENIX FAST 2024 在美国加州圣克拉拉召开,继去年获得国内首个FAST最佳论文奖后,凭借在分布式块存储上的创新,阿里云新作再次斩获FAST大会最佳论文奖。这也是国内唯一一家连续两年获得FAST最佳论文奖的科技公司。
106793 105
|
编解码 算法 固态存储
SSD ECC纠错“天网”之LDPC码
在之前的文章中有提到过,SSD FTL层有一个很重要的功能就是ECC纠错(ECC, Error Correction Code)。
|
Dart Java 编译器
Android编译器及编译工具之编译器
习惯了IDE以及各种现成的编译工具为我们提供便捷的编译方式,我们很少会操心编译工具的编译过程和原理,但是工具越高级,隐藏的细节就越多,这样编译遇到问题时我们难以定位,遇到复杂的项目(尤其跨平台项目难以用ide)时不知如何下手。所以准备写两篇关于编译器和编译工具的文章。本文先来介绍编译工具。
441 0
|
存储 缓存 弹性计算
阿里云Optane+QLC存储实践案例分享
本文主要分享主题在阿里云本地盘存储中,基于Optane SSD和SPDK WSR的功能,降低QLC SSD的写放大。
|
IDE 开发工具
掌握条件断点,调试技巧大揭秘
掌握条件断点,调试技巧大揭秘
281 0