开发者社区> 唐僧0929> 正文

不用闪存了,Optane SSD为何还要28%的OP?

简介: 3D XPoint的容量超配比例,为啥跟SSD这么像?
+关注继续查看

上一篇《Intel Optane P4800X内存模式背后技术:ScaleMP》我写的偏应用模式或者增值软件方面,这两天看到同行朋友们对硬件底层也挺感兴趣的,我也来凑个热闹,班门弄斧写点东西。OPOver Provisioning,即超量配置)这个概念在SSD上已经不陌生了。

 

3D XPoint Memory有没有写放大?

 

0?wx_fmt=jpeg


关于写放大的问题,源于我在前文中写过的上面这段话。根据目前了解到的信息,3D XPoint Memory可能不是普通的相变(结晶/非结晶态转换)或者电阻式存储介质,不像闪存要有一个P/E Cycle,即改写数据时不用先进行擦除操作了。这样也就不需要垃圾回收(GC,理论上编程的长度单位可以不受诸如页面、块之类的限制。那我为啥还给了个“写放大”的评价?

 

前两天有位朋友曾为此和我深入讨论。由于当前的Intel Optane SSD DC P4800XNVMe块设备,对操作系统的驱动来看也是像SSD闪存那样仿真512byte4KB的磁盘扇区。这是进出SSD最小的I/O单位,如果底层介质的性质足够好,在此基础上可能就真的没有写放大了。

 

而我在前文中讨论的是配合ScaleMP来模拟内存,这时如果我只发出64byte的操作请求,如果不是连续地址不考虑预读/写合并的话,落到P4800XNVMe块设备上就会“变大”。除非有一天Optane能真正按照内存的方式来工作。

 

举个简单的例子,一个文件如果我只改几个字节,落到磁盘I/O上最小单位也是块(扇区),P4800X应该只能按照后者来处理。

 

0?wx_fmt=jpeg

记得几年前我曾经写过一篇《十亿IOPS不是梦?Fusion-io闪存API另类分析》,其中就讨论过8PCIe SSD如何跑出1.25 IOPS。这里是通过Fusion-ioAtomic WriteAPI来仿真出来的“64byte块”,真正落到闪存上的是经过了合并,以达到一种理想的顺序I/O。如果是换成读操作就没这么简单了。

 

为啥是7个通道、28%超量配置?

 

0?wx_fmt=jpeg


根据之前看到的资料,Optane P4800X使用的3D XPoint Memory技术为128Gb 20nm,每颗16GiB(注意我这里使用的单位)。如上图,背面14颗加上正面一共28颗芯片,物理容量为448GiB

 

那我用448除以375GB的标称容量,是不是就可以算出OP比例呢?答案是不准确

 

0?wx_fmt=jpeg

375 /1024/1000/1024/1000/1024/1000=349 GiB

 

有的朋友可能没注意到我在前文中写的“349GIB”,其实是个简单的道理,SSD一直沿用硬盘标称容量的方式,按照1000进位,而实际格式化容量是1024,所以会有一个差值。

 

这时再计算P4800XOP就是28%——一个在NAND闪存企业级SSD上常见的超供比例。对于这28%都用来干啥用,国外网站上是这样写的:

 

3D XPoint memory media doesnot have or require the extra capacity, so over-provisioning doesn't reallyapply. With that said, spare capacity beyond the user defined area is leveragedfor ECC, firmware, and other maintenance operations

 

前面说过,由于3D XPoint能就地改写,不像NAND闪存SSD那样需要OP来做垃圾回收,那么就是用于ECCFirmware和其它维护操作了?

 

关于这方面,我与下午在微信群里看到的一位朋友观点基本相同。(由于没有官方资料确认,只好大胆猜测一下,如果写错欢迎指正

 

我们知道内存是在芯片之间做ECC,而NAND闪存是在颗粒内部(实际容量比用户容量要大),那么128Gb 3D XPoint Memory会不会内部已经包含了ECC校验位呢?

 

在企业级SSD上,比较常见的颗粒间容错技术是XOR,有点像RAID 5磁盘阵列。也就是说单个芯片失效仍保证数据可用。接下来的一个问题就是,XOR或者P+Q校验是在芯片之间,还是通道之间?

 

如果在芯片之间,那么除了6+1之外,还可能有13+126+2这样比例的可能,有些情况下需要7个通道2-4次并行操作才能写完一轮数据。这样对预防单个芯片失效应该可以,并且控制器内部集成少量DRAM或者SRAM也是很正常的。

 

而我还看到一种说法——目前的3D XPoint介质误码率还比较高。当然这只是相对而言,而且Intel肯定也在产品设计中用了各种技术来弥补。因此我倾向于认为6+1的通道间XOR比较合理,这样也能达到ECC的效果。而如果设计更多的通道数,则遇到“双错误”的概率会增大,也不排除另一种说法——7个通道性能已经够用。

 

0?wx_fmt=jpeg

这里借用GreenLiant绿芯的一张图参考下(详见《FPGA搞不定LDPC?分布式ECC助阵SSD》),因为我听说Optane使用的3D XPoint每颗芯片上也包含局部控制功能。

 

假设上述猜测属实,448GiB减去1/7剩下384GiB,比349GiB还多出大约35GiB。剩下最后两点,Firmware——按照常规理解单独一个小容量Flash Rom就可以吧?不确定3D XPoint Memory需要多大容量,如果像元数据那样放在主存储介质中,就有点不像底层Firmware的感觉了。

 

至于维护操作,显然还是需要有的。虽然不用GC了,但磨损平衡还要做,包括数据完整性扫描、搬移这些后台操作应该会有,以及像NAND闪存那样预留一些空间替换损坏的存储单元。

 

简单写这么多吧,在专家眼里我的认识可能又浅薄了:)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
19625 0
如何设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云安全组设置详细图文教程(收藏起来) 阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程。阿里云会要求客户设置安全组,如果不设置,阿里云会指定默认的安全组。那么,这个安全组是什么呢?顾名思义,就是为了服务器安全设置的。安全组其实就是一个虚拟的防火墙,可以让用户从端口、IP的维度来筛选对应服务器的访问者,从而形成一个云上的安全域。
16991 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
11729 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
24749 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
32688 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
14635 0
腾讯云服务器 设置ngxin + fastdfs +tomcat 开机自启动
在tomcat中新建一个可以启动的 .sh 脚本文件 /usr/local/tomcat7/bin/ export JAVA_HOME=/usr/local/java/jdk7 export PATH=$JAVA_HOME/bin/:$PATH export CLASSPATH=.
13388 0
+关注
唐僧0929
企业存储、服务器、工作站等领域技术分享,交流。微信公众号《企业存储技术》,微博 @唐僧_huangliang
34
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
OceanBase 入门到实战教程
立即下载
阿里云图数据库GDB,加速开启“图智”未来.ppt
立即下载
实时数仓Hologres技术实战一本通2.0版(下)
立即下载