华为服务器保持高性能和高可靠性的秘密

简介:

通过第三方调研机构数据可以看出,华为服务器出货量不断攀升,得益于其持续通过高强度的研发投入和聚焦创新,从而为用户提供高可靠、高性能、简单易用的计算平台。

高性能方面,华为服务器在此颇具口碑,共打破300多项性能测试世界纪录;质量更可靠,故障率低于业界15%。如何做到的?今天我们从华为服务器信号质量一探究竟。

信号质量是服务器的性能和可靠性关键一环,然而信号质量具有隐蔽性,不为用户感知,常被用户忽略。本文详解华为服务器信号质量。

0.025mm意味着什么?

信号好坏与链路质量相关。链路好比一条高速公路,信号好比汽车,高速公路路况好,汽车可以在高速路快速行驶,并安全到达目地;如果高速链路阻抗不一致,就好比高速公路路面坑坑洼洼,信号在该通道上传输,会造成信号的衰减、失真,导致信号的误码。特别是CPU间的UPI链路、CPU与外设之间PCIe链路和CPU与内存之间的DDR链路,信号质量好坏对服务器性能至关重要。

在多路关键业务服务器,如8100 V3服务器,高达6000多条高速链路(UPI、DDR4、PCIe),有的链路长度超过500mm,链路过长且数量多,过孔、电容、连接器连接导致链路复杂,有限的空间内链路间相互干扰和受外部干扰影响会成倍增加。华为工程师细心思考与精心设计,采用三维立体设计方法:计算节点分布在Y空间排列;前后IO交错布局,充分利用X空间;利用高密高速连接器降低Z空间;再将链路精度精确到0.025mm,成功化解信号链路阻抗不一致性难题。

信号仿真,挑战极限

完成设计只是高质量第一步,接下来是信号仿真。

以PCIe高速链路为例,信号在PCB间是通过BGA ball,过孔、电容、连接器连接在一起,要求信号在穿过上述部件时,阻抗要保持一个很小的波动范围,确保信号在这条高速路上跑得畅通,需对各部件进行3维全尺寸建模仿真优化,确保链路阻抗波动最小;经历几百次的信号仿真测试与优化,信号质量高规格达标,部分信号波动范围小于CPU要求的30%。

也许你要问信号质量很难为客户感知,为什么去挑战极限、追求卓越?

这么做的背后是因为,极端环境下,机房温度或者湿度超过规范范围时,只有信道阻抗足够小,信号仍能高质量传递,系统才能正常运转,业务才能继续进行。

华为独门绝技:眼图检测

每一个优秀的产品除了优秀的设计,还必须经得起严苛的测试。

华为服务器除了常规的测试外,还包含非正常环境加严测试。加严测试包括:1、满荷运载;2、温循测试;3、电压超压和低压拉偏测试;

更值得说的是生产引入信号数字眼图检测,这是华为独门绝技,所谓的眼图好比人的眼睛,眼睛正常开启,说明这人的精神很好,如果眼睛睁的过大或者过小,说明这人很疲乏。在生产阶段,引入眼图自动化检测,快速检测出其它手段很难发现的信号质量不良的单板。

由此,华为用创新的检测方法,避免不良设备流入市场。

所以,总结来看,华为经过加严测试的服务器,信号质量能得到保证,最终将体现在性能高、非正常环境稳定运行、长时间稳定运行等质量优势,这也是更多客户选择华为服务器的理由之一。


原文发布时间为: 2017年8月14日

本文作者:陈广成

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关文章
|
14天前
|
存储 运维 数据挖掘
服务器数据恢复—华为OceanStor存储数据恢复案例
服务器存储数据恢复环境: 华为品牌型号为OceanStor S2600T的存储设备,存储上有一组由24块4T容量的机械硬盘组建的RAID5阵列,作为存储池使用。 图1 服务器存储故障&检测: 存储设备中raid5阵列上多块硬盘出现故障离线,raid5阵列失效,数据无法正常访问。 关机后将存储中所有硬盘标记&取出,硬件工程师对所有硬盘进行硬件故障检测。经过检测,没有发现存在物理故障的磁盘,都可以正常读取。
|
3月前
|
存储 内存技术
【RAID磁盘阵列服务器数据恢复】华为OceanStor Dorado存储系统RAID-TP数据丢失数据恢复案例
客户报告其华为OceanStor Dorado存储系统的RAID-TP出现故障,导致数据丢失。RAID-TP是一种增强型RAID级别,包含数据磁盘、校验磁盘和转换磁盘,可在两个磁盘故障时仍保护数据。通过分析RAID结构与工作原理,我们制定了恢复方案:首先从校验磁盘读取信息并计算出丢失的数据块,接着将恢复的数据写入新磁盘。由于缺乏现成工具,需定制RAID重组程序以恢复数据。华为的动态RAID重构技术保证了重构过程中冗余级别的稳定。
56 1
|
3月前
|
Rust 安全 开发者
惊爆!Xamarin 携手机器学习,开启智能应用新纪元,个性化体验与跨平台优势完美融合大揭秘!
【8月更文挑战第31天】随着互联网的发展,Web应用对性能和安全性要求不断提高。Rust凭借卓越的性能、内存安全及丰富生态,成为构建高性能Web服务器的理想选择。本文通过一个简单示例,展示如何使用Rust和Actix-web框架搭建基本Web服务器,从创建项目到运行服务器全程指导,帮助读者领略Rust在Web后端开发中的强大能力。通过实践,读者可以体验到Rust在性能和安全性方面的优势,以及其在Web开发领域的巨大潜力。
41 0
|
3月前
|
缓存 监控 Linux
在Linux中,如何设计一个高性能的Web服务器?
在Linux中,如何设计一个高性能的Web服务器?
|
5月前
|
JavaScript Serverless 网络架构
Next.js与SSR:构建高性能服务器渲染应用
创建Next.js项目使用`create-next-app`,每个页面自动支持SSR。动态路由如`pages/posts/[id]`,在`getStaticPaths`和`getServerSideProps`中获取数据。利用静态优化和预渲染提升性能,动态导入减少初始加载时间。使用`next/image`优化图片,自定义服务器增加控制,集成第三方库如Redux。优化SEO,利用i18n支持多语言,使用Serverless模式和Web Workers。项目支持TypeScript,创建`_error.js`处理错误,部署到Vercel并使用工具进行性能监控和优化。
219 4
|
4月前
|
监控 JavaScript 前端开发
JavaScript与Nest.js:打造高性能的服务器端应用
Nest.js是Node.js的渐进式框架,融合OOP、FP和FRP,提供模块化、装饰器和依赖注入,助建高性能服务器应用。选择Nest.js的原因包括模块化设计、简洁的装饰器API和高性能基础(如Express或Fastify)。开始使用需安装Node.js和`@nestjs/cli`,创建项目、编写控制器。深入学习涉及模块化、服务的依赖注入及中间件。安全性优化涵盖HTTPS、CORS策略、限流和性能监控。
103 0
|
6月前
|
弹性计算 运维 负载均衡
【阿里云弹性计算】阿里云ECS在金融科技中的应用案例:高性能交易系统的构建
【5月更文挑战第27天】阿里云ECS助力某证券公司构建高性能交易系统,满足高并发、高可用和弹性扩展需求。ECS凭借最新处理器技术、高速内存实现高性能计算;支持多地域、多可用区部署保证高可用性;弹性伸缩特性适应业务波动,降低运维成本。通过分布式架构和负载均衡技术,实现交易请求高效处理,确保系统稳定运行。案例证明,阿里云ECS是金融科技领域构建高性能交易系统的理想选择。
239 1
|
5月前
|
缓存 负载均衡 应用服务中间件
Nginx 是一个高性能的开源反向代理服务器和 Web 服务器
Nginx 是一个高性能的开源反向代理服务器和 Web 服务器
75 0
|
5月前
使用高性能服务器训练StableDiffusion——人物模型.safetensors
使用高性能服务器训练StableDiffusion——人物模型.safetensors
54 0
|
6月前
|
弹性计算 缓存 安全
【阿里云弹性计算】阿里云ECS与CDN结合:构建高性能全球内容分发网络
【5月更文挑战第26天】阿里云ECS与CDN结合打造高性能全球内容分发网络,通过ECS的弹性伸缩和安全可靠性,配合CDN的全球覆盖、高可用性及安全防护,提升访问速度,减轻服务器压力,优化数据传输。以WordPress为例,通过配置CDN域名和ECS,实现高效内容分发,提高系统扩展性和稳定性。此解决方案满足用户对访问速度和稳定性的高要求,为企业提供优质的云计算体验。
176 0
下一篇
无影云桌面