关于SSD何时取代硬碟的议题中,有两个观察指标:一是储存密度或容量的对比,二是单位容量成本的对比。
面对SSD的竞争,更大的容量(以单一装置而言),与更低的单位容量成本,是传统硬碟仅存的少许优势,但其中容量更大一项,已即将为SSD所超越。当前最大容量10TB硬碟问世还不过1年时间,容量更大的15.3TB SSD已经在2016年上半年开始出货,一举逆转硬碟原有的容量优势。
从下半年起,主要的企业级储存设备都将陆续支援15.3TB规格的SSD,但随着这类超大容量SSD的应用,也给企业储存带来新的问题,进而将带动新的储存架构发展。
容量增长速度惊人的SSD
在技术进步的驱动下,无论硬碟还是SSD的容量都在持续增长,但两者的成长速度不同。由于储存装置的外型尺寸规格是固定的,所以是透过容量密度的提高来使容量向上增长,硬碟容量的成长取决于磁录技术进步所带来的磁录密度成长,而SSD的容量成长则取决于半导体制程技术的进展。相较于硬碟磁录技术,半导体制程技术的进步更快,也给SSD带来更快的容量成长速度。
SSD虽然直到2013年初才突破1TB容量,而同时期的硬碟最大容量已有6TB。但2年后,市场上就有4TB容量的SSD可买,相较之下,硬碟容量从1TB成长到4TB,便花了将近5年时间。
而到了2016年中的现在,硬碟最大容量虽然从3年前的6TB增加到10TB,提升了66%的容量,但在SSD方面,随着3D NAND Flash记忆体技术的实用化,SSD容量更是以倍于从前的速度持续增长,2015年初出现了6TB SSD,2016年初又有13TB容量的SSD上市,现在更大的7.68TB与15.3TB容量SSD,也都即将在下半年上市,较3年前增加了15倍。
硬碟容量从1TB成长到当前的10TB,足足花了8年多,相对的,SSD从1TB成长到15TB容量,却只花了3年多,由此可见两种储存媒体的容量成长速度差异。
而且10TB硬碟是属于3.5寸规格,而SSD的标准规格是2.5寸,以更小的尺寸却能提供高出50%以上的容量,因此双方的容量密度还有着更大的差距。
一直到2016年上半年之前,硬碟相对于SSD都还拥有容量优势,但随着SSD导入3D NAND技术,从2015年起储存容量便急速增长,到2016年上半年已正式超越硬碟。
超大容量SSD即将进入企业储存应用
直到今年5月之前,企业级储存设备可用的2.5寸SSD,最大容量仍是3.84TB,多数产品支援的最大容量规格则是3.2TB。
不过,随着三星的15.3TB容量SSD在2016年上半年开始出货(2015年8月发表),企业储存设备也陆续支援了这种超大容量SSD。
例如,在5月底发布的ONTAP 9作业系统中,NetApp宣布将支援15.3TB的SSD,是第一个支援这种容量规格的企业级储存系统。接下来HPE亦在6月初宣布,旗下的3PAR StoreServ储存产品线将支援7.68TB与15.3TB SSD(目前StoreServ 8000系列型录中,已有7.68TB SSD可选,15.3TB款式应会在稍晚提供)。Dell亦向我们透露,将在下半年为主力储存产品线与伺服器产品,引进7.68TB与15.3TB的SSD。
虽然7.68TB与15.3TB的SSD上市初期的价格仍十分昂贵(市价据称达到2~4万美元),但可一举将储存系统容量提高2~4倍,因此我们可以预期,到了今年年底时,主要储存与伺服器供应商,都会陆续支援这类型SSD。
不过从另一方面来看,随着这类超大容量SSD的导入,也企业储存应用带来下列新的问题。
系统可用性疑虑增加
随着SSD储存容量的增加,如今只需较少数量的SSD,就能组成相同容量的储存阵列。例如在主流企业端SSD最大容量只有3.2TB的过去,必须使用16台SSD才能组成50TB的储存群组,现在改若用15.3TB SSD便只需4台。但这也意味着,当一台SSD失效时,所造成的影响也更大。
以前面那个例子来说,使用3.2TB SSD组成50TB储存群组时,每台SSD平均保存整个系统6%资料量,一台SSD失效时,只有6%的资料需要重建;而换成15.3TB SSD时,由于每台SSD保有整个系统25%的资料,一旦失效,就得重建多达25%的资料量,需要的重建时间与资料遗失风险都大幅提高了数倍。
事实上,随着单一磁碟机容量增加,造成RAID群组资料重建时间大幅增长的问题,在4TB、6TB等大容量硬碟问世时就已经存在,现在当SSD容量赶上甚至超越硬碟后,由SSD组成磁碟群组的环境,也开始要面临这个问题。
亟需引进新一代RAID保护技术
传统的RAID技术必须在磁碟群组中指定备用的Hot Spare磁碟,当磁碟失效、必须进行资料重建时,写入负担将集中在Hot Spare磁碟上,以致成为重建时的效能瓶颈,因此需要重建的资料量越大,重建时间也将以线性增长。
当硬碟或SSD容量达到10TB以上时,如果再继续使用传统RAID技术,势必将面临重建时间过长,以及系统可靠性不足的问题。
要解决这个问题,必须分为2个层次来处理。
首先,是必须提高磁碟群组的可靠性。当单一磁碟机或SSD的容量达到数TB程度时,由于需要的重建时间已相当长,只允许整个群组损失1台磁碟的RAID架构是不够用的,在漫长的重建期间内,若有另1台磁碟失效,整个群组便无法恢复,所以至少必须提供等同于RAID 6、允许损失2台磁碟的架构,才能保证系统进行资料重建时,还拥有基本的保护能力。
而当单一磁碟容量达到10TB等级时,磁碟失效所需的重建时间又增加了数倍,此时RAID 6等级的保护也不够充分,将需要透过Erasure code技术,引进更多的校验磁碟来确保可靠性。例如NetApp新提出的RAID-TEC,与Nimble Storage的RAID 3P+等技术,都提供了允许磁碟群组损失3台磁碟的容错能力,
其次,是必须设法减少磁碟群组重建时间。这需要舍弃传统RAID架构,改用分散式的新型RAID架构,不再使用单一的Hot Spare磁碟,而是将重建负担分散到所有磁碟机,藉此大幅提高系统的重建效率。例如HPE 3PAR的FAST RAID、NetApp的动态磁碟池(Dynamic Disk Pool)、Dell源自Compellent的动态区块(Dynamic Block),或是华为的RAID 2.0等,都是属于这类新创的RAID架构。
对专属规格SSD需求减少
先前曾有某些厂商,透过专属的Flash模组,来提供大于标准2.5寸SSD的容量,或是超越SATA/SAS等标准传输介面的效能。
例如HDS在2013年中发表HUS VM全快闪储存阵列时,便发表了比同时期标准规格SSD容量大了4倍的3.2TB专属FMD模组。稍后IBM 2014年初发表的Flash System 840,也提供了4TB容量的专属Flash储存模组。接下来HDS又在2015年底发表6.4TB的FMD模组,也比同时期标准规格SSD的最大容量多了近70%。
但在3D Flash记忆体技术的应用下,现在只需使用2.5寸标准规格的SSD,就能提供更大的容量,搭配NVMe等新型I/O介面,也能提供十分可观的效能,因此,专属规格Flash模组的价值明显已经大幅降低。
市面上第一款15.3TB容量硬碟,是三星的PM1633Ma,利用48层的3D V-NAND Flash晶片组成512GB容量的记忆体封装,然后结合32组记忆体封装成为15.3TB超大容量的SSD,但外型仍是标准的2.5寸规格,采用12Gb SAS介面。NetApp、HPE与Dell的储存设备都将陆续支援这款SSD。
====================================分割线================================
本文转自d1net(转载)