教程:如何用固态硬盘(SSD)创建零级存储

简介:
  目前,又出现了一种新型存储层:Tier 0。Tier 0是一种固态存储器存储,在Tier 1的基础上提高性能。过去,Tier 0的存储形式为RAM磁盘,价格不菲。实际上,为了降低RAM磁盘的较高成本,你不仅需要确保由存储引起的性能问题,还应该说明在RAM磁盘上的投资能得到回报。

但是,目前这种情况已经发生了变化。固态硬盘成本降低,数据中心可以更加容易地采用SSD技术。尽管SSD成本降低,吸引力增强,但公司还是会首先考虑性能问题,然后才决定是否选择SSD技术。

要创建Tier 0存储,首先应明确需要存储哪些数据。

要与4U SSD匹配的性能需要巨大、昂贵的磁盘阵列。以及大型磁盘LUN对多个硬盘分条。根据常理,简单才能胜出。4U SSD简单实用,大型磁盘阵列采用驱动器安装,复杂繁琐,两者之间,大多数用户都会选择SSD。

SSD有两种形式:基于RAM的系统和基于闪存存储器的系统。闪存存储器正在改变SSD。尽管闪存的性能不如RAM系统,但是相比传统的磁盘阵列——即使是高性能阵列,速度明显加快,从而成为某些数据中心的完美解决方案。

基于RAM的系统价格比闪存要贵。例如,目前闪存SSD的容量购买点通常为2TB。2TB的闪存存储器通常需要19万美元。基于RAM的SSD容量通常为128GB,需要7万美元。如果购入2TB的RAM SSD,费用将超过100万美元。

目前,闪存SSD的销售量超过RAM SSD(从总容量上讲),不过RAM SSD系统的销售量也在增长。如果你需要RAM SSD,可以调整额外的开支。

与闪存SSD系统不同的是,RAM系统对写入的数据量没什么要求。闪存系统能处理的写入数据量有一个理论限制值。另外,闪存系统无法提供和RAM系统相同的写操作性能。

因此,如果文件非常活跃,I/O写操作频繁,具有恢复日志和撤销片段,那么RAM系统就是不错的选择。如果在数据库环境中,恢复日志和撤销片段影响了当前磁盘的I/O性能,此时利用RAM就能迅速提高I/O性能,实现投资回报。

怎么创建Tier 0

创建Tier 0的第一步是明确需要存储哪些数据。采用RAM系统后,这些应用程序的I/O读操作事务性能较高。在这些应用程序中,某些特定文件处于“炽热”状态,也就是说,这些文件非常活跃,需要的I/O高于磁盘子系统所能提供的I/O。

我们回头看看前面的情况,即数据库的恢复日志和撤销片段安置在RAM磁盘中。有三种可行的解决方案:升级为更快(更贵)的磁盘阵列;在阵列中更多的硬盘间传播数据(只是你更容易遭受双硬盘故障的情况);购买SSD。这些应用程序的I/O读操作性能很高,与闪存存储器相比,非常适合采用RAM系统。安装RAM SSD的另外一个优势为延迟期很低。虽然许多应用程序同时具备低延迟、高IOPS的特性,但是相对而言,延迟期比IOPS的顶峰绝对数量更加重要。

在闪存系统中工作良好的数据往往来自读操作密集型的应用程序,至少是读操作比较频繁的程序。闪存系统如果具有足够的RAM缓存,就能支持大量的读操作,也就意味着其适用的应用程序对磁盘I/O要求较高,但是无法判断个人文件,如数据仓库等。

相比RAM系统,闪存系统容量大、能耗低。由于闪存SSD可用容量较大,因此能将整个数据库系统迁移到SSD中。

保护Tier 0

如何保护这种新型的Tier 0?毕竟,Tier 0是一种存储器。通常,闪存在模块中捆绑出售,而模块分布在阵列组里,其中一个模块作为奇偶校验硬盘。这样就能有效构建RAID 3保护策略。同样,与USB驱动器中的存储器类似,闪存硬盘维护存储数据不需要消耗能源。

RAM硬盘时刻需要能源,数据保护成为最重要的问题。一些RAM系统采用电池备份方式,具有内置硬盘,万一系统由于人为原因或缺电原因被关闭,也能存储数据。在没电的时候,RAM硬盘电池能够供系统运行,同时将数据复制到硬盘中,以防电池耗尽了,电力还没有恢复。

基于RAM的SSD还采用纠错存储器(ECC)技术和IBM的Chipkill 技术。(惠普公司也提供相似技术,称为Chipspare)。这些技术都提供先进的纠错和改错技术,保护计算机的存储系统免受存储晶片故障的影响,以及存储片端口多位故障的影响。

例如,Chipkill技术通过在多个存储晶片中分散ECC位数,实现纠错功能;这样,一片存储晶片发生故障,只会影响一位ECC。因此,即使一片晶片完全发生故障,系统也能重建存储内容。

Chipkill技术结合了动态位迁移技术,因此如果晶片发生故障(或超过位错误的临界值),闲置的存储晶片就可以替代故障晶片。这种理念与RAID的理念相似,能够保护磁盘故障,只不过现在是将理念运用到单个的存储器晶片中。20世纪90年代,IBM公司开发Chipkill技术时,主要针对主框架和高端Unix系统,但是Chipkill技术现在主要在SSD中使用。IBM公司对Chipkill技术影响的研究表明,Chipkill能使存储器系统中数据丢失的概率降低两个数量级。

基于RAM的系统:是绿色环保吗?

基于RAM的系统绿色环保吗?如果比较每TB容量消耗的电量,那答案就是否定的,但现实中并非这么比较。一直以来,如果应用程序的磁盘I/O性能不佳,都是通过创建LUN,部署高性能硬盘,以提高性能。阵列中硬盘越多,磁盘的I/O速度越快。这些额外的硬盘需要更多能耗,尤其是采用非虚拟化存储技术时,非虚拟化环境中的大量磁盘容量得不到利用。为了提高速度,用户不得不牺牲容量利用率。

SSD无需额外的硬盘,而是在硬盘之外提高速度。因而需要的硬盘数量较少,能源消耗速率也就较低。

可能实现的性能

通常,硬盘驱动器的读写操作速率会4-5msec,随机I/O约为每秒150-300次。基于RAM的SSD读写操作速率为.015 msec,I/O约为每秒400,000次。基于闪存的SSD读操作速率为0.2 msec,写操作速度为2-msec。I/O性能为随机读操作每秒100,000次,写操作每秒25,000次。

Texas Memory Systems公司已经开发出能缓存的闪存SSD。公司采用基于RAM的缓存技术,传输相同的性能给RAM SSD,效果也很好。

除了Texas Memory Systems等在SSD市场中处于领先地位的公司, EMC、Sun、NetApp和Hitachi数据系统公司等存储阵列生产商也开始参与SSD,试图满足快速市场快速增长的需求。例如,NetApp和HDS公司有望在今年发布SSD解决方案。

 
  作者:过客
来源:51CTO
目录
相关文章
|
Ubuntu Linux Python
Linux(15)Ubuntu安装ninja构建工具
Linux(15)Ubuntu安装ninja构建工具
4563 0
|
8月前
|
人工智能 Java Nacos
基于 Spring AI Alibaba + Nacos 的分布式 Multi-Agent 构建指南
本文将针对 Spring AI Alibaba + Nacos 的分布式多智能体构建方案展开介绍,同时结合 Demo 说明快速开发方法与实际效果。
5292 101
|
4月前
|
人工智能 弹性计算 运维
2026年OpenClaw(Clawdbot)全场景实战手册:新手零基础从部署到运维通关指南
2026年,AI智能体行业迎来爆发式增长,而OpenClaw(前身为Clawdbot、Moltbot)凭借其“自然语言驱动、全流程自动化、生态高度开放”的核心优势,成为GitHub上增长最快的开源项目之一,截至2026年2月,星标数已突破18.6万,Fork量达3.2万。这款由奥地利开发者Peter Steinberger打造的工具,彻底打破了传统AI助手“只对话、不落地”的局限,实现了“思考-规划-执行-反馈”的完整闭环,无论是个人办公自动化、轻量团队协作,还是新手开发者辅助,都能无缝适配。
1212 1
|
11月前
|
存储 机器学习/深度学习 缓存
阿里云AirCache技术实现多模态大模型高效推理加速,入选国际顶会ICCV2025
阿里云研发的AirCache技术被计算机视觉顶会ICCV2025收录,该技术通过激活跨模态关联、优化KV缓存压缩策略,显著提升视觉语言模型(VLMs)的推理效率与存储性能。实验表明,在保留仅10%视觉缓存的情况下,模型性能下降小于1%,解码延迟最高降低66%,吞吐量提升达192%。AirCache无需修改模型结构,兼容主流VLMs,已在教育、医疗、政务等多个行业落地应用,助力多模态大模型高效赋能产业智能化升级。
787 1
|
供应链 监控
业务连续性计划(Business Continuity Plan, BCP)
业务连续性计划(Business Continuity Plan, BCP)
1645 1
|
12月前
|
JSON 生物认证 API
harmony-utils之DeviceUtil,设备相关工具类
DeviceUtil 是 HarmonyOS 工具库 harmony-utils 中的设备相关工具类,提供设备信息获取与操作功能,如设备 ID、型号、系统版本、电池状态、振动控制等,助力开发者高效构建鸿蒙应用。
420 0
|
12月前
|
存储 编解码 Prometheus
大模型推理加速实战:vLLM 部署 Llama3 的量化与批处理优化指南
本文详解如何通过量化与批处理优化,在vLLM中高效部署Llama3大模型。涵盖内存管理、推理加速及混合策略,提升吞吐量并降低延迟,适用于大规模语言模型部署实践。
2690 10
|
11月前
|
JSON 自然语言处理 Nacos
垂直和领域 Agent 的护城河:上下文工程
上下文工程是智能体应对复杂任务的核心能力,通过对项目状态、需求文档、团队沟通等多维度信息的结构化整合,提升大模型输出的准确性与适配性。它超越传统提示词工程,构建系统化的信息输入框架,使智能体更贴近人类思维逻辑,成为实现高质量人机协作的关键方法。
878 0
|
数据采集 数据可视化 数据挖掘
利用 Jupyter 实现自动化报告生成 展示如何结合 Jupyter 和 Python 库
【8月更文第29天】为了创建自动化报告,我们可以利用 Jupyter Notebook 结合 Python 的强大库如 Pandas、Matplotlib 和 Seaborn 来处理数据、制作图表,并使用 Jinja2 模板引擎来生成 HTML 报告。这种方式非常适合需要定期生成相同类型报告的情况,比如数据分析、业务报表等。
1310 1
|
存储 弹性计算 数据管理
阿里云OSS对象存储收费标准价格表:流量包+存储包2025最新整理
阿里云OSS对象存储2025收费标准及请求费用等,提供按量付费与包年包月两种模式。标准型本地冗余存储按量价为0.09元/GB/月,包年包月如500GB仅118.99元/年。流量费仅收公网出方向,闲时0.25元/GB、忙时0.5元/GB。更多详情见官网。
5640 2