低延时应用 & 服务器TurboBoost不可得兼?

简介: 比如金融行业需要稳定低延时的高频交易应用,就不希望CPU频率跳来跳去。那么能否让TurboBoost变得更加可控?

RSA整机架服务器DSS 9000现身数博会

数据中心选址贵阳理由:天、地、电

 

因为前几年听书《明朝的那些事》,我曾慕名去了两个地方,一个是杭州于谦故居,另一个就是贵阳的阳明祠。对于看书不多的我来说,从那时起有些崇拜王守仁和他那“知行合一”的哲学理论。

 

其实技术上有些思路,也是与哲学相通的。

 

TurboBoost初期的3ds Max渲染测试说起

 

当年3ds Max的渲染测试截图不好找了,我就拿一张SolidWorks最终渲染的屏幕照片做为替代,正好前一段测试了Dell Precision T5810T3420工作站。手机拍的质量不好大家见谅:

 

记得Intel10来年前的Xeon 5500系列时期引入TurboBoost睿频技术,这一动作当时似乎没有将内存控制器、以及后来的PCIe控制器整合进CPU那么受人关注。本质上说是CPU技术发展遇到频率功耗墙——然后开始推多核——部分软件的并发线程上不去导致有的核心空闲。此时CPU功耗距离TDP(热设计功耗)尚有余量,不如索性自动“超频”来提高性能

 

谈到图形工作站上的CPU渲染(或者说最终生成),无论3ds Max还是SolidWorks等都会充分把CPU的线程用满。比如我在上图中圈出的16个“小窗”,实际上是一颗48线程的Intel Xeon E5-1620 v4 CPU,拍照时正好处于前8个小窗渲完,另外新开8个小窗的切换时刻。这里TurboBoost能发挥作用吗?

 

上面引用这份较早的资料,今天还是同样的道理。处于活动的CPU核心越少,TurboBoost可超频的幅度就越大,这一点我想许多做技术的朋友都清楚。而当所有核心被程序占满时,Intel部分CPU还支持小幅的TurboBoost,据说判断标准是此时TDP是否超标

 

具体到实际产品上,当年我测过一款Xeon W5580的工作站,3ds Max渲染时监控CPU主频,印象中就是以1秒间隔很规律的在3.20GHz3.33GHz之间切换。这样当然也比频率一直固定在3.20GHz原始频率上效率要高一点,但不是所有应用都适合这么干。前两天还与做数据库的朋友聊过这个,比如金融行业需要稳定低延时的高频交易应用,就不希望CPU频率跳来跳去

 

这时大家可能会想起服务器/工作站BIOS里有个限制CPU核心数的选项,对于某些要求单核心性能的应用,修改这个应该可以把TurboBoost幅度保持在高水平。另外,理论上每颗CPUTurboBoost和节电状态可以根据负载不同来单独控制,那么可以给一台服务器上多个CPU限制不同的核心数吗?

 

例如以前有的4CPU TurboBoost的描述是3/2/2/1,也就是从单核到4核能够超频的幅度(100133MHz的倍数)。那么如果我们预设目标是双核的频率+200MHzTurboBoost能否设一个上限选项?以确保在只有一个Core活动时频率也不会往上跳。

 

写到这里,我还想起之前在撰写《一项Xeon E5-2600 v4测试数据的背后》时看过的一份资料。

 

AVXnon-AVX Turbo频率的差异

 

引用自《Performance and Energy Efficiency of Dell PowerEdge Servers withE5-2600 v4

 

上图的字有点小,点击放大后可以看清。从这里我了解到之前没太注意的一点,目前流行的Xeon E5 v4Intel CPU执行AVX指令时频率会有所降低,估计也是功耗方面考虑吧。这个频率也分为至少3种——TDP基础频率、最大Turbo频率、全部核心最大Turbo频率——在AVXnon-AVX状态下都可能会有不同。

 

这里有个问题,双路或者四路服务器,当部分CPU上有AVX指令运行是否会影响到余下CPU的频率?当时我并没有想到这一点,而最近才了解到这些早已有人考虑过。

 

DPAT处理器加速技术:原理上并不复杂

 

上图来自我在网上搜到的一个文档,Dell亚太区服务器产品经理吴鹏程曾经分享的资料《戴尔13G服务器性能提升与最佳实践》,里面提到了Dell Processor AccelerationTechnologyDPAT2.0技术。

 

这里给出的图示应该不难理解,我这人写技术喜欢捞干货。正如前面所讲的,如果所有CPU核心都开着,你不能保证在几个线程工作的情况下不会有其它程序偶尔把别的空闲核心也用起来(即使做了绑核),这时TurboBoost频率就会受到影响。

 

上图介绍了DPAT技术实现的几种场景

 

DPAT1.0:我理解就是在全部核心工作时稳定TurboBoost的水平;

DPATPro场景1:所有CPU运行Non-AVX代码,只限制CPU1的核心数到4 Core3.3G TurboCPU 2跑在18 Core最大Turbo频率2.8G

DPATPro场景2:跑满全部核心,但只有一个CPU运行AVX代码,此时2CPU频率相差200MHz

DPATPro场景3:与场景1的区别在于,全部CPU或者只有CPU2运行AVX代码,此时CPU2的最大Turbo频率降为2.6G

 

据了解DPAT是个免费的技术,只需要在做服务器配置时选择一个License即可支持。使用中有多种途径可以打开,最简单的一个方法是在BIOS中可以看到Number of Cores for Processor 1这样针对每颗CPU的核心数的限制,还有Processor 1 Controlled Turbo可以独立调整每颗CPU TurboBoost频率上限的选项。

 

同时应确保System Profile设置为Performance mode,或者Custom mode选项并将CPU Power Management设为Maximum Performance mode并打开Turbo Boost mode

 


上面是DPAT针对的主要目标应用场景。如果有用户想详细了解Intel CPU在使用不同核心数时设计的具体TurboBoost档位,另外还有Dell针对低延时应用环境的更多最佳实践,可以找这方面的技术顾问来咨询。

 

最后再推荐给大家一篇我写的《 无奖竞猜:影响服务器性能的内存配置
目录
相关文章
|
2月前
|
机器学习/深度学习 数据库 数据安全/隐私保护
服务器核心组件:CPU 与 GPU 的核心区别、应用场景、协同工作
CPU与GPU在服务器中各司其职:CPU擅长处理复杂逻辑,如订单判断、网页请求;GPU专注批量并行计算,如图像处理、深度学习。二者协同工作,能大幅提升服务器效率,满足多样化计算需求。
1318 39
|
1月前
|
存储 机器学习/深度学习 人工智能
硅谷GPU单节点服务器:技术解析与应用全景
“硅谷GPU单节点服务器”代表了在单个物理机箱内集成强大计算能力,特别是GPU加速能力的高性能计算解决方案。它们并非指代某个特定品牌,而是一类为处理密集型工作负载而设计的服务器范式的统称。
|
1月前
|
机器学习/深度学习 人工智能 弹性计算
2025年阿里云GPU服务器租用价格与应用场景详解
阿里云GPU服务器基于ECS架构,集成NVIDIA A10/V100等顶级GPU与自研神龙架构,提供高达1000 TFLOPS混合精度算力。2025年推出万卡级异构算力平台及Aegaeon池化技术,支持AI训练、推理、科学计算与图形渲染,实现性能与成本最优平衡。
|
4月前
|
弹性计算 关系型数据库 数据库
阿里云服务器ECS是什么?ECS应用场景、租用流程及使用教程整理
阿里云ECS(弹性计算服务)是性能稳定、弹性扩展的云计算服务,支持多种处理器架构和实例类型,适用于网站托管、开发测试、数据存储、企业服务、游戏多媒体及微服务架构等场景。提供从注册、配置到部署、运维的完整使用流程,助力用户高效上云。
|
3月前
|
域名解析 运维 监控
阿里云轻量服务器的系统镜像和应用镜像的区别
轻量应用服务器是阿里云推出的易用型云服务器,支持一键部署、域名解析、安全管理和运维监控。本文介绍其系统镜像与应用镜像的区别及选择建议,助您根据业务需求和技术能力快速决策,实现高效部署。
|
3月前
|
存储 弹性计算 运维
阿里云服务器全解析:ECS是什么、应用场景、租用流程及优缺点分析
阿里云ECS(Elastic Compute Service)是阿里云提供的高性能、高可用的云计算服务,支持弹性扩展、多样化实例类型和多种计费模式。适用于网站搭建、数据处理、运维测试等多种场景,具备分钟级交付、安全可靠、成本低、易运维等优势,是企业及开发者上云的理想选择。
627 5
|
3月前
|
运维 监控 Kubernetes
Bitnami 替代品:Websoft9 如何接力单服务器多应用时代
Bitnami 曾为开源应用部署带来革命性体验,但随着 Docker 成熟与战略转向云原生,其单机多应用支持逐渐弱化。面对多应用管理分散、资源冲突、运维工具缺失等痛点,Websoft9 应运而生,提供一键部署、统一管理、智能调度等能力,全面优化单服务器多应用运维体验,成为 Bitnami 的理想继任者。
156 0
Bitnami 替代品:Websoft9 如何接力单服务器多应用时代
|
3月前
|
资源调度 负载均衡 JavaScript
使用PM2工具部署Vue.js应用于服务器
以上步骤完成之后,你就成功利⽤ PM⼆工具将 Vuejs 应⽰程序部署至服 务 器,并且配合反向代理实现了高效稳定访问及负载均衡功能。
179 0
|
4月前
|
Java Linux 网络安全
Linux云端服务器上部署Spring Boot应用的教程。
此流程涉及Linux命令行操作、系统服务管理及网络安全知识,需要管理员权限以进行配置和服务管理。务必在一个测试环境中验证所有步骤,确保一切配置正确无误后,再将应用部署到生产环境中。也可以使用如Ansible、Chef等配置管理工具来自动化部署过程,提升效率和可靠性。
523 13

热门文章

最新文章