英特尔持续推动NAND技术创新,引领数据中心QLC SSD普及浪潮

简介: 2021中国闪存市场峰会(CFMS)9月14号在深圳成功举行,今年主题为 “存储标准 - 存储生态”。这场高标准市场化运作的峰会,得到众多产业链核心厂商的积极响应和大力支持,英特尔、三星、美光、铠侠、长江存储等企业悉数到场。英特尔NPSG亚太区销售总监倪锦峰在会上发表了“英特尔推动NAND技术创新,释放存储潜力”的主题演讲,承诺英特尔会继续加强对NAND技术的投入,并且通过今年新发布的D5-P5316新一代QLC SSD,推动QLC技术在数据中心的普及。

英特尔继续引领NAND技术创新


要说英特尔在NAND领域的技术创新,就不得不提其独特的浮栅架构。英特尔的浮栅架构是英特尔NAND最具差异化的可靠性技术,使得其QLC SSD的可靠性可以媲美TLC SSD。英特尔独特的浮动栅极技术可以实现业内领先的面密度,更小的单元尺寸,预计比替代性技术小大约15%。而且英特尔还拥有把控制逻辑电路放到内存阵列下的独特方法:阵列下CMOS。这两项技术结合起来,使得面密度比替代性产品高10%。这是因为阵列下CMOS不会浪费空间,从而可以在几乎每平方毫米晶圆上制造更多存储单元。


微信图片_20220105113252.jpg


英特尔领先的Floating Gate(浮栅)技术,其采用经过充分验证的技术来解决3D NAND单元可靠性挑战。浮栅技术通过隧道氧化层控制电子流动。浮栅技术能够做到单元隔离,也就是电荷存储节点是隔离的。这种独特方法可以非常好地防止电荷丢失和单元间干扰。独特的垂直全环绕栅极结构可以让每个单元提供的电子数接近平面浮动栅极的6倍。更多电子意味着更高的控制力,更小的容差。更多电子容量还意味着可以让存储单元受到少量电子泄漏造成的电压变化的影响更低。


微信图片_20220105113256.png


RWB (Read Window Budget,阈值电压窗口)指标对于NAND可靠性至关重要。RWB越大越好,出错概率越小。下图展示了1b/c一直到4b/c之间的差别,你会注意到位之间的差距越小,每个单元的位数越多。然而,如果看看下图右侧的图表——其中对比了浮动栅极单元和电荷捕获单元两种技术的RWB——可以看到浮栅单元的RWB高于电荷捕获技术。RWB越高,数据保留周期就越长,可靠性越好,从而也更容易实现4b/c, 5b/c等技术的产品化。英特尔浮栅技术的RWB非常卓越,这大大提升了QLC的数据维持能力,很好地加速QLC的商用化落地,并给后续的PLC等带来了曙光。


微信图片_20220105113325.jpg


至于NAND的性能,英特尔最新采用了Block By Deck(BBD)和独立多平面读操作(IMPRO)两种提高性能的机制。


微信图片_20220105113329.jpg


在BBD架构中,英特尔用虚拟层将每个Deck分开,每个Deck可以作为SLC或QLC运行。为了更有效地擦除区块,每块Deck可以被擦除而不触及存储在其他Deck上的数据。英特尔表示,这种方法对垃圾收集有极大的帮助,并能显著提高服务质量(QoS)。


英特尔还实施了一种新的独立多平面读操作(IMPRO)技术,通过将四个平面分割成可以异步读取的两个双平面组,使固态硬盘可以同时独立接收和执行读取命令,从而使读取操作的性能翻倍。IMPRO的异步性质会产生噪音耦合。为了减轻这种影响,英特尔配置了电荷泵、字线/位线调节器和降压(LDO)调节器,以驱动每个平面组中的独立负载。


这些独特技术的采用,可以持续提高英特尔 NAND的性能,从而改进SSD的性能和扩展性,也让英特尔继续保持在NAND技术的领先优势。特别是针对QLC新介质,英特尔更是提供了比业界同行更可靠,更快速的QLC SSD新品D5-P5316固态盘,让数据中心普遍采用QLC成为功能。


进一步提高可靠性

英特尔D5-P5316新品引领QLC在数据中心全面普及


数据正呈现出指数级增长,IDC 数据显示,全球数据量到 2025 年预计将增长至 175 ZB1。这一增长速度超乎想象,但我们不只面临数据量不断增长的挑战,还要确保更多 数据的可用性,保持数据的 “暖” 属性,将数据用于当前的关键业务应用,如分析、人工 智能(AI)、机器学习(ML)和内容交付网络(CDN)。例如,随着越来越多不同类型 的数据馈送到这些应用中,AI 和分析结果的准确性通常会随之提高。组织部署的大容量 存储需要为相关工作负载提供海量、且不断增长的温数据。


许多组织在其数据中心内部署了成本较低的机械硬盘(HDD),以满足不断增长的存储 容量需求。但机械硬盘无法满足现代工作负载对更快读取访问速度的需求。机械硬盘还 会占据数据中心的较大面积,因而会增加空间、电源、散热和替换方面的成本。


一些组织采取的策略是将较慢、较笨重的机械硬盘,更换为更快、更密集的三层单元 (TLC)NAND 固态盘(SSD)。TLC NAND 固态盘适用于混合和写入繁重的工作负 载,如高速缓存应用,但通常未经过成本和容量优化,难以满足以读取为中心的大规模 数据需求。


更切实可行的选择是用英特尔® QLC 3D NAND 固态盘替换机械硬盘,其兼具成本效益出 色的大容量和远超机械硬盘的读取性能。事实上,与机械硬盘相比,30.72TB 英特尔® 固态盘 D5-P5316 可将温数据存储的空间占用降低多达 20 倍。相比机械硬盘的持续 传输速率,英特尔 QLC 3D NAND 固态盘还可提供最高达 25 倍的顺序读取性能。而且 英特尔 QLC 3D NAND 固态盘还可提供密度优化与媲美 TLC 的读取性能,因而可帮助组 织大幅降低读取密集型存储工作负载的资本支出(CapEx)。


但是,很多人对QLC的可靠性还是保持怀疑态度,认为QLC目前主要用在消费级领域,在企业数据中心中使用还是有所担心。


其实,对于大多数现代工作负载部署,QLC NAND 固态盘可提供富余的耐用性,因为:• 英特尔QLC NAND的实际耐用性超出了传统认知和理论限制。• QLC NAND 固态盘具有更大的容量,能够将磨损分散到更大的区域。• 大多数固态盘在使用的全程,只会消耗一小部分额定的固态盘寿命。


1、实际耐用性与预期耐用性英特尔固态盘 D5-P5316 证明,QLC NAND 固态盘可以提供行业领先的耐用性水平。此外,QLC NAND 固态盘的真实耐用性在多个方面超出了预期。通过固态盘驱动控制器将写入均匀分布到盘上,可以避免一些单元受到反复冲击。大容量 QLC NAND 固态盘提供了更大的 “表面积” 来分配写入,从而减少整体退化。此外,对耐用性需求的认识与实际使用模式之间存在显著差距, 2020 年 2 月 USENIX 大会上公布的一项大规模研究对此进行了重点说明。该研究报告指出,实际应用下的耐用性要求通常远低于企业的预期。作者表示:“基于我们的数据,我们预测并认为,对于绝大多数企业用户来说,转向 QLC 在固态盘寿命上没有风险,因为 99% 的系统最多使用了其硬盘 15% 的额定寿命。”


2、大容量QLC NAND的寿命耐用性等于更小容量的TLC固态盘耐用性通常按照每日固态盘写入次数(DWPD)衡量, DWPD可测量在保修寿命内磁盘每日可写入的数据量。写入 TB 数(TBW)或写入 PB 数(PBW)也可用于表示耐用性,该指标可衡量在规定寿命内可写入磁盘的总数据量。磁盘的总耐用性取决于其容量。

微信图片_20220105113434.jpg

例如,上图所示为一个 8TB TLC 固态盘(1DWPD,5年保修寿命),理论上可在 5 年内每天处理 8TB 的 数据写入。但请注意,额定 DWPD 为 0.25 的 5 年保修期 32TB QLC NAND 固态盘可写入该固态盘的数据总量与较小的 TLC 磁盘相同(32TB 容量乘以 0.25 DWPD)。


3、对于 NAND 固态盘耐用性,工作负载很重要面向不同应用场景的固态盘耐用性也取决于客户的使用模式和工作负载的性质。例如,如果应用依赖于小数据块的频繁随机写入,它将比大块数据的顺序读取更多地消耗 NAND 固态盘的寿命。这就是为什么 QLC NAND 固态盘适用于读取繁重的工作负载,这类工作负 载也需要大容量以快速访问更多数据。


此外,存储管理人员可以通过留出额外的硬盘空间来进一步提高有效耐用性。通过增加硬盘上的保留区域,将能够为有效的碎片整理和磨损均衡来留出更大的空 间,进而减少写入放大。


微信图片_20220105113456.jpg


从上图英特尔固态盘D5-P5316的写入PB数对比,我们看到,如果提供20%的OP(超供),则写入量提高一倍以上。如果顺序写入,写入量有4倍以上的提升。


虽然针对读取性能进行了优化,QLC NAND 也适用于其他数据使用模式。凭借支持大数据块的充足写入性能,QLC NAND 能够支持某些细分市场的混合工作负载。


微信图片_20220105113513.jpg


上图列出了 QLC NAND 非常适合的一系列工作负载(基于 I/O 模式)。


由于 QLC NAND 技术很复杂,因此业内许多人认为必须在数据 可靠性、数据保持和硬盘整体可靠性等方面进行妥协。但凭借三十年的浮栅架构经验,英特尔打造了一款毫无妥协的解决方案。英特尔 QLC 3D NAND 固态盘满足联合电子设备工程委员会 (JEDEC)的所有要求,相当于广泛采用的 TLC NAND 固态盘。


微信图片_20220105113529.jpg


上表显示了英特尔 QLC NAND 固态盘与 TLC NAND 固态盘的比较情况。两者具有相同的故障率、不可纠正的位错误率(UBER)、 操作振动和温度范围,以及同样的 5 年保修。


写在后面


相信大家和我一样,从英特尔在2021中国闪存市场峰会的演讲上看到了英特尔 NAND的未来良好的发展前景。英特尔持续在NAND上的投入和创新,让英特尔的SSD将继续成为企业数据中心的首选。同时,英特尔的QLC SSD新品D5 P5316固态盘,具有和TLC SSD相当的可靠性和读性能,特别适合数据中心AI、ML等新型工作负载,必将加速QLC SSD在中国数据中心的普及。


相关文章
|
8天前
|
存储 运维 区块链
区块链技术对数据中心的潜在影响
区块链技术对数据中心的潜在影响
|
6天前
|
存储 人工智能 自动驾驶
数据中心是AI和数字经济浪潮的核心
数据中心是AI和数字经济浪潮的核心
|
3月前
|
机器学习/深度学习 存储 监控
利用机器学习技术优化数据中心能效
【7月更文挑战第36天】在数据中心管理和运营中,能源效率已成为关键性能指标之一。随着能源成本的不断上升以及环境保护意识的增强,开发智能化、自动化的解决方案以降低能耗和提高能源利用率变得尤为重要。本文探讨了如何应用机器学习技术对数据中心的能源消耗进行建模、预测和优化,提出了一个基于机器学习的框架来动态调整资源分配和工作负载管理,以达到节能的目的。通过实验验证,该框架能够有效减少数据中心的能耗,同时保持服务质量。
|
6月前
|
存储 大数据 数据处理
探索现代数据中心的冷却技术
【5月更文挑战第25天】 在信息技术迅猛发展的今天,数据中心作为其核心基础设施之一,承载了巨大的数据处理需求。随着服务器密度的增加和计算能力的提升,数据中心的能耗问题尤其是冷却系统的能效问题日益凸显。本文将深入探讨现代数据中心所采用的高效冷却技术,包括液冷解决方案、热管技术和环境自适应控制等,旨在为数据中心的绿色节能提供参考和启示。
|
6月前
|
人工智能 监控 物联网
探索现代数据中心的冷却技术
【5月更文挑战第27天】 在信息技术迅猛发展的今天,数据中心作为信息处理的核心设施,其稳定性和效率至关重要。而随着计算能力的提升,数据中心面临的一个重大挑战便是散热问题。本文将深入探讨现代数据中心冷却技术的进展,包括传统的空气冷却系统、水冷系统,以及新兴的相变材料和热管技术。通过对不同冷却方式的效率、成本及实施难度的分析,旨在为读者提供一份关于数据中心散热优化的参考指南。
|
6月前
|
机器学习/深度学习 资源调度 监控
利用机器学习技术优化数据中心能效
【5月更文挑战第30天】在数据中心管理和运营中,能源效率的优化是降低运营成本和减少环境影响的关键。本文旨在探讨如何应用机器学习技术来提升数据中心的能源效率。通过对现有数据中心运行数据的深入分析,开发预测性维护模型,以及实施智能资源调度策略,我们可以显著提高数据中心的能效。本研究提出了一种集成机器学习算法的框架,该框架能够实时监控并调整数据中心的能源消耗,确保以最佳性能运行。
|
6月前
|
存储 大数据 数据中心
提升数据中心能效的先进冷却技术
【5月更文挑战第27天】 在信息技术不断进步的今天,数据中心作为计算和存储的核心枢纽,其能源效率已成为评价其可持续性的关键指标。本文将探讨当前数据中心面临的热管理挑战,并展示一系列创新的冷却技术解决方案,旨在提高数据中心的能效,同时确保系统的稳定性和可靠性。通过对比传统冷却方法和新兴技术,我们将分析各种方案的优势、局限性以及实施难度,为数据中心运营者提供科学的决策参考。
|
5月前
|
移动开发 监控 前端开发
基于 HTML5 WebGL 和 VR 技术的 3D 机房数据中心可视化
基于 HTML5 WebGL 和 VR 技术的 3D 机房数据中心可视化
|
6月前
|
机器学习/深度学习 数据采集 资源调度
利用机器学习技术优化数据中心能效
【5月更文挑战第27天】 在本文中,我们探讨了一种基于机器学习的技术框架,旨在实现数据中心能效的优化。通过分析数据中心的能耗模式并应用预测算法,我们展示了如何动态调整资源分配以减少能源消耗。与传统的摘要不同,此部分详细阐述了研究的动机、使用的主要技术手段以及期望达成的目标,为读者提供了对文章深入理解的基础。
|
6月前
|
机器学习/深度学习 敏捷开发 测试技术
深入理解自动化测试:框架选择与实践挑战利用机器学习技术优化数据中心冷却系统
【5月更文挑战第27天】 在现代软件开发周期中,自动化测试已成为确保产品质量和加快市场投放的关键步骤。本文深入探讨了自动化测试的框架选择问题,并剖析了实施过程中面临的挑战及其解决方案。通过比较不同测试框架的特点,我们旨在为读者提供一套明确的指导原则,帮助他们根据项目需求做出恰当的技术决策。同时,文中还分享了实际案例和最佳实践,以期帮助开发团队克服实施自动化测试时可能遇到的障碍。