现代数据中心标准COTS服务器的演进

简介:

数据中心内的x86商用成品(COTS)服务器的标准化已经经过了很长时间,因为该架构提供了多功能、低成本、易于集成、更有效地维护和管理配置文件,总而言之,其成本低于专用硬件的方式。但目前业界出现了驱动数据中心服务器选择的新的需求,即需要数据中心服务器能够支持运营商的虚拟化、可编程性以及机器学习和高级实时分析带来的大量的数据集。

网络功能虚拟化(NFV)和软件定义网络(SDN)逐渐在数据中心中得以实现,底层硬件已经逐渐从运行的智能软件中抽象出来。

IDC全球基础设施实践项目主管Ashish Nadkarni表示:“数据中心的选择是基于标准化的理念,其目标是实现软件层的智能化,远离硬件的专业化。每个用户都在使用业界标准的芯片而不是定制化的芯片,以便通过简单地替换软件堆栈,可以使用类似的服务器来实现多用途。应用程序本身逐步得到虚拟化,并通过编排层实现服务器之间的迁移。”

理论上来看,这应该会加强COTS的趋势,在某些用例中,大的I/O性能需求推动用户转向使用专有硬件,因为使用纯粹的“白盒”不能满足下一代网络架构的需求。

Nadkarni表示:“当用户拥抱通用的硬件时,它是不合适的。因为标准的CPU虽然能够实现很多功能,但在任何方面它都不能做到最好。用户采取这种方式可以提高效率,但其性能并不能支持NFV或认知计算。”

性能提升的需求
NFV和SDN可能是最显著的工作负载,使可用的COTS服务器性能受到限制,但是下一代工作负载的范围和需求要远超于传统数据中心的架构:在大数据分析实施中实现大型数据集和动态实时应用程序;AI(人工智能)、机器学习和认知计算环境;安全。这些应用都需要提高I/O性能,以提供最佳的最终用户体验,这意味着服务器必须具备高性能、低延迟和高速缓存一致性。

IHS Markit云数据中心研究实践高级研究总监兼顾问Cliff Grossner认为:“电信运营商和大型服务提供商对数据包处理的要求与传统数据中心的需求大不相同。这些环境中的很多应用程序都是数据包处理应用程序,当我们考虑到下一代产品和网络时,他们需要加速和提高数据包处理平面性能的策略。”Cliff Grossner认为这不是一个单独的问题,而是当AI技术成为产品组合的必要组成部分。

他说:“用于分析和AI应用的代码处理器将在电信和NFV中大量使用,电信运营商和其他厂商将使用遥测技术来改善用户体验并提高用户的自主性,这些算法可以从加速中受益匪浅。随着服务器的发展,服务器将拥有越来越多的核心处理器,可以一次处理多个数据点,从而加快重复计算速度。”

调整服务器
如果要支持这些新的业务模式需要通过数据平面开发套件(DPDK)调整通用CPU,以优化高级用力。这是Intel青睐的一种方式,它涉及到一个优化应用程序与网卡(NIC)通信数据路径的编程架构。通过这种方式,它能够更快地处理数据包,这对于处理大量以太网数据包处理或高消息速率的应用程序,如虚拟网络功能(VNF)尤为重要。

另一个方式是实现硬件加速的智能网卡,由Mellanox,Cavium和Netronome等公司目前提供这样的智能网卡。这些网卡上的SoC能够支持服务器在网卡上运行数据包转发平面,从而从CPU中卸载该工作负载,释放资源并提高性能。

Grossman表示:“10到15个内核中的任何工作都可以通过数据包处理来实现,因此可编程的网卡可以让CPU自由地执行其他操作,这些可以在白盒上或其他服务器上实现。”

Nadkarni表示:“这使得服务器非常标准,但是用户可以使用定制化的硬件来扩充服务器。”

开源持续成熟
服务器的发展过程中另一个重要因素是开源的持续成熟。未来的服务器可能会通过高速架构连接多个加速处理组件,这将推动对标准化的需求。为此,OpenCAPI于去年秋季推出,作为新的接口标准,可使诸如FPGA、图形、网络和存储加速器等高性能加速器以高性能的方式与服务器通话。与早期的PCle 3方式相比,OpenCAPI具有25 Mb/s的数据传输速率,PCle 3的传输速率只有16 Mb/s。

然后可以在配置中实现OpenCAPI和其他的开放标准,例如Rackspace和Google最近公布了OCP的OpenPower服务器平台,代号为Zaius和Barreleye G2.与以前的OpenPower系统相比,Zaius将CPU性能和内存容量提高了一倍,并且还增加了外设带宽。它依靠OpenCAPI将GPGPU、FPGA和其他专业处理器结合在一起,并使他们能够更快更方便地进行编程。

由于高级用例没有显示采用减速的迹象,因此平衡数据中心性能与提高标准服务器效率将是一个挑战。例如,可以通过诸如内存总线、大型高速缓存和高频、高功率处理器等增强功能来提升性能,但在某种程度上,这些将需要数据中心中的业态或低温冷却系统。随着行业的发展,开源标准将成为解决这个问题的孵化室。

Grossner表示:“这是保证运营商NFV健康发展并未厂商提供新的方式进行交互的重要局侧,这个生态系统尤为重要。”

本文转自d1net(转载)

相关文章
|
3月前
|
安全 数据中心
数据中心服务器机架是什么
数据中心服务器机架是用于容纳服务器、存储器等IT设备的结构,旨在提升数据中心的管理与运营效率。常见的类型包括开放式机架、封闭式机柜和壁挂式机架,每种类型各有特点,适用于不同的场景需求。选择时需考虑尺寸、承重、冷却效率及安全性等因素,以确保最佳的使用效果。
145 4
|
9月前
|
安全 Java 数据中心
Confluence 数据中心和服务器中的严重漏洞 CVE-2023-22515
Confluence 的开发者 Atlassian 已承认此漏洞,并将其归类为损坏的访问控制问题。他们强调需要立即采取行动,并建议用户升级到最新版本以保护他们的系统。Atlassian 将该漏洞的严重级别评定为 Critical CVSS 10。
86 0
|
存储 安全 中间件
数据中心厂商超云加入龙蜥社区,多款服务器完成与龙蜥操作系统适配
欢迎超云加入龙蜥社区,未来将在市场活动、产品兼容认证、行业解决方案等方面合作。
数据中心厂商超云加入龙蜥社区,多款服务器完成与龙蜥操作系统适配
|
弹性计算 数据中心 RDMA
绿色是检验数据中心的黄金标准、DBStack、RDMA、 ECI 和 ECS
绿色是检验数据中心的黄金标准、DBStack、RDMA、 ECI 和 ECS自制脑图
122 0
绿色是检验数据中心的黄金标准、DBStack、RDMA、 ECI 和 ECS
|
Rust 安全 网络安全
损失惨重!数据中心失火,360 万个网站下线,Rust 游戏 25 台服务器数据永久丢失
数据中心失火,360 万个网站被迫下线,一些企业甚至还没有灾难恢复计划,这是被一锅端了?
260 0
损失惨重!数据中心失火,360 万个网站下线,Rust 游戏 25 台服务器数据永久丢失
|
云计算 数据中心 芯片
|
存储 数据中心 云计算
带你读《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2数据中心服务器电能利用率(一)
《企业数字化基石-阿里巴巴云计算基础设施实践》第三章数据中心能效3.2(一)
601 0
|
9月前
|
存储 传感器 监控
探索现代数据中心的冷却技术革新
【4月更文挑战第23天】 在信息技术迅猛发展的今天,数据中心作为计算和存储的核心枢纽,其稳定性和效率至关重要。然而,随着处理能力的增强,设备发热量急剧上升,有效的冷却方案成为确保数据中心持续运行的关键因素。本文将深入分析当前数据中心面临的热管理挑战,并探讨几种前沿的冷却技术,包括液冷系统、热管技术和环境自适应控制策略。通过比较不同技术的优缺点,我们旨在为数据中心管理者提供实用的冷却解决方案参考。
|
6月前
|
机器学习/深度学习 存储 监控
利用机器学习技术优化数据中心能效
【7月更文挑战第36天】在数据中心管理和运营中,能源效率已成为关键性能指标之一。随着能源成本的不断上升以及环境保护意识的增强,开发智能化、自动化的解决方案以降低能耗和提高能源利用率变得尤为重要。本文探讨了如何应用机器学习技术对数据中心的能源消耗进行建模、预测和优化,提出了一个基于机器学习的框架来动态调整资源分配和工作负载管理,以达到节能的目的。通过实验验证,该框架能够有效减少数据中心的能耗,同时保持服务质量。
|
9月前
|
存储 大数据 数据处理
探索现代数据中心的冷却技术
【5月更文挑战第25天】 在信息技术迅猛发展的今天,数据中心作为其核心基础设施之一,承载了巨大的数据处理需求。随着服务器密度的增加和计算能力的提升,数据中心的能耗问题尤其是冷却系统的能效问题日益凸显。本文将深入探讨现代数据中心所采用的高效冷却技术,包括液冷解决方案、热管技术和环境自适应控制等,旨在为数据中心的绿色节能提供参考和启示。

热门文章

最新文章