存储性能101:服务器、阵列与网络架构基础

简介:

长期以来,数据都是一种蕴含着价值的商品,不论是在企业内部环境中部署,抑或是放到公有云端去实现,它 都是IT系统的核心所在。自上世纪50年代,磁带和磁盘发明后,我们便产生了在存储介质上持久存放数据的需要。

当然,这种持续的数据存储是要付出代价的。不论是磁盘、磁带或是闪存,存储设备的速度都无法赶上处理器和内存系统的发展。于是,为了得到良好的整体存储性能,我们必须不断尝试各种方式,使得存储介质运转得更快。

我们在外部存储介质中保留数据通常只有两种原因:长期存储和数据保护。

长期存储意味着在应用程序关闭或服务器断电后数据仍然能得以保留。数据无法长期驻留于系统内存(DRAM),所以当服务器或应用程序发生故障时,数据每隔一段时间就要写入到相应的介质之中。

数据保护亦是至关重要的,服务器有时会出现故障,甚至发生一些意想不到的事故灾害,如果不在多个存储介质上创建冗余,保留多个数据副本,我们很容易会遇到麻烦。数据保护机制包含RAID、纠删码和快照等,它们可以用来保护数据免遭物理和逻辑损坏,以及常见的“使用者操作失误”。

存储的性能指标

存储性能的评估通常使用这三种指标。

延迟:用以衡量设备的响应时间。系统内存的延迟通常以纳秒(ns)为单位、闪存以微秒(μs)计,而硬盘驱动器的单位则用毫秒 (ms)。

带宽:表示设备在特定时间段内传输数据的能力,通常以每秒兆比特(Mbps)或每秒千兆比特(Gbps)为单位。

吞吐量:代表了设备传输数据的实际能力,通常以每秒兆字节(MBps)或每秒千兆字节(GBps)为单位。

虽然看似类同,但带宽与吞吐量却有着本质上的差别。例如,硬盘驱动器(HDD)和固态驱动器(SSD)接口的最大带宽相同,但其输入/输出(I / O)顺序或随机、读或写的数据吞吐量却有着天壤之别。

在理想环境中,所有的数据都将存储在系统内存之中,以最快的性能提供访问,但系统内存代价不菲且容易丢失,服务器内又只能配置有限的容量。大多数应用程序不需要一直访问所有的数据,考虑到成本因素,我们访问这些数据的频繁程度和所要求的速度决定了数据最适合的存储位置。

那么,如何才能充分利用存储资源呢?我们可以怎样调优,才能以最低的成本赢得最佳性能?

存储介质性能的比较

在深入探讨之前,我们先来看下可供企业选择的各种存储介质的层次结构。

DRAM:是在性能和延迟方面都表现最佳的存储介质,缺点是所存储的内容并不稳定。DRAM容量扩容并不容易,而且不能在多台服务器之间轻松共享。DRAM可以按字节寻址。

NVDIMM:使用和DIMM相同的外形尺寸,可以像DRAM那样非常快速,并且在断电时可以借助闪存或其它技术来保留内容。其在速度上略逊于DRAM,也有类似的访问性和扩展性问题。NVDIMM通常以字节寻址。

闪存:非常快速的持久存储介质,并具有良好的可扩展性,可作为单台服务器或是存储阵列的组成部分。它比DRAM便宜很多,并按数据块寻址。根据不同价格、性能、成本可以区分出不同的闪存类型,如MLC、TLC等。

硬盘驱动器:一种相对较慢的,用以长期存储数据的介质,现在更多用于归档和备份数据的存放。硬盘驱动器同样是数据块寻址的。

上述这些介质均可单独或混合使用,从而实现了一系列不同存储性能的方案。

服务器内部的存储介质选择

存储可以直接部署在服务器内部,尽可能靠近中央处理器,缩短数据的I/O路径,从而减少延迟。

闪存则必硬盘具有更高的性能水平。根据访问数据的性能需求,可以组合使用不同闪存/硬盘驱动器容量配比的方案,从而在成本和性能之间达成平衡。闪存与系统内存可以用作高速缓存来存放活跃的数据,而同时将相对静止的数据存储到硬盘驱动器上。

这其中涉及到命中率的问题,即活跃数据都存储在缓存中,根据命中率可以推测出I/O性能。如果数据需要从硬盘驱动器而非缓存中读取,那么其访问请求的性能将受到影响。一种方案是将廉价和昂贵的不同闪存类型混合使用,从而实现适合的方案性价比。

服务器中存储的另一项考虑因素是要防止设备故障。假如驱动器发生故障,那么服务器可能要完全宕机才能更换部件,除非该设备支持热插拔。假如服务器发生故障,内部设备上的数据都将无法访问,因此我们需要复制数据。这取决于将一组服务器连接起来的网络的速度,给I/O增加了额外的延迟。

考量存储阵列的性能

共享存储阵列为数据带来了更高的可用性和更好的可访问性,不过由于需要遍历以太网或光纤通道的存储网络,这可能会造成延迟。

目前一些新产品正在上市,提供不同的连接选项(如RDMA,RoCE和NVMe)等解决方案。相比传统的存储网络,这些新技术虽然扩展性较差,但显著降低了延迟。

存储阵列亦可以通过选择不同的存储介质来改善性能。

DRAM缓存能够改进读写性能,而混合系统中的闪存与磁盘驱动器则能实现最好的方案性价比。

同时,与上文中讨论的“缓存未命中”问题的风险相比,全闪存系统能够确保所有数据的I / O性能与延迟。

闪存技术的应用引发了一系列技术的产生,已经不在局限于单纯地提高吞吐量、解决延迟。通常来说,用越多的内存和闪存来取代磁盘,我们就能得到越好的存储性能。

存储网络的性能

当使用外部存储阵列时,我们可以通过调整存储网络以提高整体系统的性能。

最新的主机总线适配器(HBA)带来了非常高的带宽(32Gbps光纤通道、40Gbps和100Gbps以太网),而网络交换机则实现了很低的延迟。通常来说,更快的单个设备都会促使整体系统的性能得以更好地发挥,尽管不断升级交换机的成本或许是不容小觑的。通过添加更多的前端连接(额外的HBA),我们可以将工作负载扩展分配到更多的连接之上,从而提高对存储阵列的吞吐量。

另有一些其它的技术同样可以改善性能:

负载均衡:这项技术能够在尽可能多的设备上平衡资源的利用率。这意味着你可以将数据扩展分布到多块磁盘(闪存或硬盘驱动器),并充分利用所有连接,能够在服务器和存储阵列之间实现宽条带化技术。

负载优化:访问活跃数据会产生较重的工作负载,可以将其迁移到更快速的设备上,例如闪存,由于闪存代价不菲,因此需要尽可能使用在最需要的地方。假如可以克服服务器可用性的问题,那么NVDIMM的应用或许可以大大提高某些工作负载的性能。

缓存:我们已经探讨过存储阵列和服务器上的缓存,其亦可以跨设备使用,即在服务器上使用DRAM和闪存,对来自外部存储的I / O进行缓存,这在读取操作上没有限制,而写出操作则要求一定的弹性以防止数据丢失。

存储网络调优:在更为复杂的存储网络中,共享存储端口和交换机之间的链路或许会变成瓶颈,需要检查队列深度和缓冲区信用阀值等设置,或者利用网络自带的拓扑技术进行优化。

通过上述讨论,我们不难看出:改善性能的前提是具备适合的度量方式。如果缺乏合适的度量工具,量化性能问题、判断问题是否得以解决便无从谈起。

所有存储供应商都会提供衡量其产品性能的工具,甚至还能实现端到端的性能测试,显示出存储对整体应用系统性能的影响。通过这些工具,你还可以看出当前实时的性能和历史的性能数值——这对于持续改进存储系统性能而言亦是至关重要的。

本文转自d1net(转载)

相关文章
|
20天前
|
存储 人工智能 容灾
阿里云服务器2核8G、4核16G、8核32G配置热门实例性能对比与场景化选型指南
2核8G/4核16G/8核32G配置的阿里云服务器在阿里云活动中目前有经济型e、通用算力型u1、通用型g7、通用型g8y和通用型g9i五种实例可选,目前2核8G配置选择u1实例活动价格652.32元1年起,4核16G月付选择经济型e实例最低89元1个月,8核32G配置160元1个月起,本文将为大家解析经济型e、通用算力型u1、通用型g7及通用型g8y实例,帮助用户根据自身需求合理选择最适合的实例规格和配置。
|
1月前
|
存储 缓存 数据挖掘
阿里云目前最便宜云服务器介绍:38元、99元、199元性能,选购攻略参考
轻量应用服务器2核2G峰值200M带宽38元1年;云服务器经济型e实例2核2G3M带宽99元1年;云服务器通用算力型u1实例2核4G5M带宽199元1年。对于还未使用过阿里云服务器的用户来说,大家也不免有些疑虑,这些云服务器性能究竟如何?它们适用于哪些场景?能否满足自己的使用需求呢?接下来,本文将为您全方位介绍这几款云服务器,以供您了解及选择参考。
|
2月前
|
存储 机器学习/深度学习 弹性计算
阿里云服务器ECS计算型c9i规格族性能与特点、配置性能参数表
阿里云ECS计算型c9i实例基于Intel® Xeon® Granite Rapids处理器,主频3.2GHz,全核睿频3.6GHz,提供稳定高性能计算能力。支持NVMe协议、vTPM安全加密,适用于机器学习、大数据分析、高性能计算等场景,具备高安全、低延迟、强扩展等优势。
|
9天前
|
开发框架 JavaScript .NET
阿里云轻量应用服务器2核2G38元1年起怎么样?性能、应用场景与购买价值参考
目前在阿里云的活动中,抢购价为38元1年的轻量应用服务器受到了众多个人和中小企业用户的高度关注,该款轻量应用服务器置为2核CPU、2G内存,峰值带宽达200M。那么,此款轻量应用服务器的具体性能如何?适用于哪些应用场景?是否具备较高的购买价值?本文将针对这款特惠轻量应用服务器展开全面且深入的测评与介绍。
213 30
阿里云轻量应用服务器2核2G38元1年起怎么样?性能、应用场景与购买价值参考
|
11天前
|
人工智能 运维 安全
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
迈格网络推出“天机”新版本,以AI自学习、全端防护、主动安全三大核心能力,重构网络安全防线。融合AI引擎与DeepSeek-R1模型,实现威胁预测、零日防御、自动化响应,覆盖Web、APP、小程序全场景,助力企业从被动防御迈向主动免疫,护航数字化转型。
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
|
14天前
|
存储 弹性计算 应用服务中间件
阿里云轻量应用服务器与云服务器ECS有何区别?轻量应用服务器性能、优势与收费价格参考
2025年,阿里云轻量应用服务器2核2G3M带宽搭配40GB ESSD云盘的配置,每天10点和15点开启的抢购价只要38元1年,新用户非抢购专属优惠价也只要68元1年。对于一些初次接触阿里云轻量应用服务器的用户来说,可能不是很清楚它与云服务器ECS有什么不同?选择轻量应用服务器有哪些优势,本文为大家介绍轻量应用服务器的性能、适用场景、优势、收费标准以及与云服务器ECS之间的区别,以供参考。
|
1月前
|
存储 弹性计算 固态存储
阿里云服务器云盘解析:ESSD AutoPL、ESSD云盘、PL-X等云盘性能与选购参考
对于初次接触阿里云服务器的用户来说,面对众多可选的云盘类型,如ESSD AutoPL、高效云盘、ESSD云盘、SSD云盘等,可能不是很清楚他们之间的区别以及如何选择。这些云盘在最大IOPS、最大吞吐量等性能指标上各有千秋,如何根据自身需求选择适合自己的云盘类型,是用户比较关心的问题。本文将为大家介绍这些云盘的区别,助您轻松找到最适合自己的阿里云云盘。
|
2月前
|
人工智能 编解码 安全
阿里云服务器上新,第9代AMD企业级实例g9ae,提升企业AI业务创新与性能突破
近日,阿里云推出的服务器ECS第9代AMD企业级实例-g9ae实例已开启邀测阶段,g9ae实例基于CIPU 2.0架构,搭载AMD Turin处理器,为国内首创物理核设计的“性能旗舰型”算力产品,专为AI时代企业离线数据处理打造。本文为大家介绍g9ae实例的性能及适用场景,以供了解与参考。
|
2月前
|
存储 机器学习/深度学习 编解码
阿里云服务器计算型c7/c8a/c8i/c8y/c9i实例性能、适用场景及价格对比与选择参考
阿里云服务器计算型c7、计算型c8a、计算型c8i、计算型c8y和计算型c9i同属于计算型实例,是目前计算型实例规格中的热门实例规格,通常在阿里云的活动中,计算型实例也主要以这几个实例规格为主,本文为大家介绍c7/c8a/c8i/c8y/c9i实例各自的实例性能、适用场景及价格对比,以供选择参考。
|
2月前
|
存储 弹性计算 网络协议
阿里云服务器ECS实例规格族是什么?不同规格CPU型号、处理器主频及网络性能参数均不同
阿里云ECS实例规格族是指具有不同性能特点和适用场景的实例类型集合。不同规格族如计算型c9i、通用算力型u1、经济型e等,在CPU型号、主频、网络性能、云盘IOPS等方面存在差异。即使CPU和内存配置相同,性能参数和价格也各不相同,适用于不同业务需求。