认识HBM vs. HMC:颠覆性能的两种服务器内存类型

简介:

数据中心硬件买家可以评估两种新兴的服务器类型内存,搭建未来高性能系统。

高带宽内存(HBM)是一种用于支持内存设备数据吞吐量的高性能接口,其性能远超常规形式的内存。

混合存储立方(HMC)技术带来远超传统高带宽内存设计的性能,如双倍数据率三代与四代(DDR3和DDR4),但是这两种方法采用的技术不同,它们对服务器内存性能的提升也有所不同。

高带宽内存的未来服务器

HBM的思路十分直接:让内存设备靠近CPU或GPU。当前的计算机设计一般会通过将内存模块安装在主板的插槽上,隔离内存与计算芯片。这类型的服务器内存受到了时钟率的限制,阻碍每个时钟周期数据的可传输量。

HBM方法将内存芯片堆叠到一个矩阵里,接着将处理器与内存堆叠组合在一起,形成一个基本组件,然后将其安装到服务器主板上。

HBM栈并不是物理上与CPU和GPU集成,而是采用载板。然而,相关支持的半导体制造商如AMD表示,HBM方案与在处理器上集成存储器的方案没有太大区别。

因此,HBM到底有哪些优势?HBM模块可以在极低的频率与更少的能耗下提供远超常规内存的带宽。例如,根据AMD的研究,一个典型的图形DDR5包使用32位总线,在1,750MHz,1.5伏电压下,最高带宽为28GB每秒。一个HBM包使用1,024位总线,只需要500MHz,1.3V电压,就能达到超过100GB的带宽。而且,HBM提供了与CPU或集成GPU支持服务器的多功能性。未来服务器可能会出现HBM同时服务CPU和GPU的情况。

混合存储立方如何影响未来服务器?

传统服务器内存类型,如DIMM,使用服务器主板上的并行接口连接独立芯片。混合存储立方与之相反,通过堆叠存储芯片到垂直组件,创建3-D阵列的串行内存访问。这些阵列增加了一个逻辑层来管理内存,而且服务器制造商可以在每个处理器附近安装这个组件。这种近内存或短距离设计是比较常见的,而且能够提供比标榜低功耗的远距离内存架构提供更高的性能。

混合存储立方可以最多连接8个包。根据HMC联合会,也就是推动该标准的供应商组织声称,HMC能够提供DDR3内存设备15倍的带宽,节约70%的能耗并且物理尺寸仅为其90%。例如,美光的2GB与4GB HMC产品技术号称带宽能达到120GB和160GB。HMC产品现已上市,而且像Intel的Xeon Phi图形协处理器采用HMC技术,能比GDDR5内存设备提升约50%的内存吞吐量。

HMC与HBM互相竞争,两种技术不兼容。


本文作者:DJ编辑

来源:51CTO

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
12天前
|
存储 缓存 应用服务中间件
|
9天前
|
弹性计算 负载均衡 数据库
阿里云轻量应用服务器收费标准、性能及适用场景全面解析
阿里云轻量应用服务器(Simple Application Server)作为面向个人开发者、中小企业等用户的入门级云产品,凭借其易用性、高性价比以及一站式服务体验,受到了广泛的欢迎。本文将全面解析阿里云轻量应用服务器的收费标准、最新活动价格以及适用场景,帮助用户更好地了解和选择这一产品。
阿里云轻量应用服务器收费标准、性能及适用场景全面解析
|
1天前
|
Kubernetes Cloud Native Java
云原生之旅:从容器到微服务的演进之路Java 内存管理:垃圾收集器与性能调优
【8月更文挑战第30天】在数字化时代的浪潮中,企业如何乘风破浪?云原生技术提供了一个强有力的桨。本文将带你从容器技术的基石出发,探索微服务架构的奥秘,最终实现在云端自由翱翔的梦想。我们将一起见证代码如何转化为业务的翅膀,让你的应用在云海中高飞。
|
3天前
|
Python
Python变量的作用域_参数类型_传递过程内存分析
理解Python中的变量作用域、参数类型和参数传递过程,对于编写高效和健壮的代码至关重要。正确的应用这些概念,有助于避免程序中的错误和内存泄漏。通过实践和经验积累,可以更好地理解Python的内存模型,并编写出更优质的代码。
8 2
|
3天前
|
缓存 NoSQL 数据库
Web服务器与数据库优化:提升系统性能的最佳实践
【8月更文第28天】在现代的Web应用中,Web服务器与后端数据库之间的交互是至关重要的部分。优化这些组件及其相互作用可以显著提高系统的响应速度、吞吐量和可扩展性。本文将探讨几种常见的优化策略,并提供一些具体的代码示例。
11 1
|
13天前
|
弹性计算 缓存 前端开发
阿里云服务器ECS u1、c7、e实例、c8i实例有什么区别?性能有差异吗?
阿里云ECS提供多样化的实例规格,满足不同需求。经济型e实例为共享资源,适合轻负载应用;通用算力型u1与计算型c7/c8i为独享资源,后者性能更优。c7与c8i均具1:2的CPU内存比,但c8i作为第八代服务器,性能超越c7。价格方面,2核4G的u1实例企业用户专享价199元/年,性价比突出。选择时,轻负载可选e实例,中等负载选u1,高性能需求则推荐c7或c8i实例。更多详情参见阿里云官方页面。
|
13天前
|
弹性计算 缓存 安全
阿里云服务器ECS实例2核4G有哪些?性能如何?
阿里云2核4G配置的云服务器提供多样化的ECS实例规格,如突发性能t6、经济型e、计算型c7/c6/c8i/c8a等,不同规格性能各异,参考价格从68元/月至203元/月不等。其中,经济型e和通用算力型u1实例为主推产品。2核4G配置理论上支持约20人同时在线访问,实际并发数受应用架构、带宽、用户行为等多种因素影响。详情参见阿里云官方页面。
|
1天前
|
存储 大数据 Python
NumPy 内存管理和性能调优
【8月更文第30天】NumPy 是 Python 中用于科学计算的核心库之一,它提供了高效的数组操作功能。然而,随着数据集的增大,如何有效地管理和优化 NumPy 数组的内存使用成为了一个重要的问题。本文将介绍一些技巧,帮助你更好地管理和优化 NumPy 数组的内存使用。
8 0
|
2天前
|
缓存 Linux 调度
Linux服务器如何查看CPU占用率、内存占用、带宽占用
Linux服务器如何查看CPU占用率、内存占用、带宽占用
8 0
|
12天前
|
存储 编译器 C语言
【C语言篇】数据在内存中的存储(超详细)
浮点数就采⽤下⾯的规则表⽰,即指数E的真实值加上127(或1023),再将有效数字M去掉整数部分的1。

热门文章

最新文章

下一篇
云函数