飞天入海的的数据中心

简介:

日前,向国际空间站补给物资的Space X Dragon飞船带来了一些新的东西:第一台飞往太空的商业电脑。通常,用于太空任务的计算机是专门设计的,可承受从飞船起飞的超重力到零重力,以及宇宙辐射的所有方面严苛的考验。而地球的上数据中心的服务器却不能承受这样的环境。Hewlett Packard Enterprise公司去年收购超级计算机供应商SGI公司,该公司首席技术官EngGoh博士说,可以进行太空旅行的加强计算机的推出可能需要数年时间。

  Space X Dragon航天器2016年4月经过迪拜上空

Goh在接受行业媒体采访时表示:“人们花了很长的时间来强化在这些恶劣的空间环境中使用的电脑,但这些电脑比较老旧,因此性能差距很大。对于某些任务来说,可能会花费更多的时间来强化系统,而不是强化使用。”然而,专门的一次性硬件的成本是很昂贵的,通常不会获得规模经济技术通常提供的优势。

Goh希望为宇航员提供最新的可用硬件,能够加载通用计算程序的标准软件,以及智能的自适应控制,将系统强化的负担从硬件转移到软件。HPE公司发送到空间站的两台水冷Apollo40已经运行了一年,这两台服务器从工厂生产出来时,并没有对硬件进行强化,进入太空轨道后,通过了NASA测试,不需要修改,这意味着其服务器应该在其他恶劣的环境也会运行得很好。

像Goh所说的那样,太空的服务器是一个实验,可以发现太空中的恶劣环境对未强化硬件的影响,以及在软件中可以做些什么来减少这种影响。这个想法是在检测到更高级别的操作时,减少服务器的功耗和运行速度,看看是否足以使它们运行。“可以使用软件来硬化计算机吗?这就是我们想要得到回答的问题。”

数据中心行业标准机构Uptime Institute研究所首席技术官Christopher Brown表示,困难环境的强化系统正在成为一个更主流的问题。随着社会越来越依赖计算和通信技术,卫星通信,GPS,计算机辅助飞机导航等,这种研究在几个小众领域用之外的地方越来越相关。Brown说,“真正超越了非常专业化的人员和群体的边缘,在某种程度上它会影响到所有的人。”

太空和地球上的计算机的经验教训

Space X Dragon飞船上的服务器位于与电源,以太网和冷冻水系统相连的储物柜中。这个方便的储物柜不是为了保护机器而设计的,则只是为了存储它们。服务器部署了SSD硬盘,不会受到零重力和电离辐射影响,安装了体积较小的快速驱动器和运行较慢的驱动器,以便在太空中更好地工作。此外还有Infiniband互连,因为铜连接可能比光纤更容易受辐射影响。该团队没有调查CPU,内存和SSD参数,而服务器运行在标准版本的RHEL 6.8操作系统中。

通用服务器将对未来的宇航员有用,因此像HPE这样的公司,这是一个有趣的潜在增长市场。Goh指出,“如果商业太空旅行与航空旅行相同,那么其市场并不小,探索空间也是人们真正需要边缘计算的地方。如果我们向火星派遣一支远征队,那么20分钟的延迟将意味着地球的系统不适合任何实时处理,如图像识别或预测分析。”

但而从太空应用得来的经验教训在地球上的应用也是有用的。HPE公司希望把它学到的东西应用到恶劣的地球环境中,并通常教电脑来更好地照顾自己。Goh说:“更高层次的目标是让计算机能够通过传感器和预警系统来适应自己的环境如今,人们为反病毒预留了一些计算周期;还应该留出周期让计算机自己照顾自己,保护自己。如果你说每秒有10亿次操作,那么人们愿意为防病毒预留0.5%,那么是否可以提供5%到8%给自我护理?”

微软在另一个极端环境中的探索

这些目标与微软公司Project Natick的目标相似。当微软公司的研究人员从微软Azure数据中心将一个42U机架的服务器内罩上一个密封的外壳,并将其沉入离岸边半英里的海底沉没时,其中的一个目标是学习如何在任何环境加速部署数据中心。

“如今,部署一个大型数据中心需要很长时间,”Natick项目研究人员Ben Cutler表示,“可能需要两年时间,因为企业必须找到一些地方来部署数据中心,首先必须获得建设数据中心的土地,必须得到许可证,建设建筑。即使拥有各种各样的千篇一律的数据中心,仍然要面对这样一个事实:土地不同,气候不同,工作规则和建筑规范都不同,电力的来源是不同的。此外,还需要很长时间。”

有时云端服务需求在一个意想不到的地方出现了高峰,而微软公司希望尽可能快地做出回应,Cutler继续说道,“我们的目的是在90天内完成数据中心计划到运营,是否可以达到在世界任何地方规模化部署数据中心的能力?”

  微软试验性水下数据中心Project Natick正在在加利福尼亚沿岸部署

出于同样的原因,微软公司开发了在新的Azure数据中心直接安装并完全部署的机架。Cutler指出:“我们通常不会做的事情是将建筑视为制成品。采用笔记本电脑或手机,人们几乎完全知道如何运作,以及在构建之前花费多少钱,你可以快速得到一个数据中心,因为在你订购时,它被拉出机架并运送到某个地方。我们想要在数据中心方面做出同样的事情。”

设计用于人工操作

海洋并没有像太空那样苛刻的环境,但它比陆地湿润,并会遭遇飓风,温度波动等恶劣天气和环境。这意味着从长远来看,在水下可靠运行的数据中心的成本将会比陆地上的数据中心成本更低。一方面,其冷却成本是目前冷却成本的20%。Cutler表示,如今的数据中心主要依靠空气冷却,这意味着它们比较温暖。“我们的假设是,如果IT设备环境的温度一直很低,那么失败率也会更低。”

服务器故障率在这里具有一个全新的层次。水下数据中心将是密封单元,其设计为在维护服务器的五年甚至十年的整个工作期间无需维护。“从历史上看,如果每年都会有对服务器进行更新,故障率并不重要,”Cutler说。然而,如今的硬件并没有像以前那样快速地更新硬件,而是可以在更长的时间内运行硬件来降低成本。

但水下数据中心没有人能够进入进行维修,Natick数据中心内充满了氮气其,内部几乎没有湿度,其湿度对硬盘来说并不全是坏处,数据中心故障的主要原因之一是电子设备中连接部分的腐蚀。随着时间的推移,湿气会导致设备中两个金属片之间短路,最终导致故障。但也不能使空气太干燥,因为某些硬盘驱动器会使用电机润滑脂和一些水分。如果低于10%的湿度,那么这些润滑油脂就会变成粉末,就会出现另一种故障。”

密封的机架可以消除灰尘问题,因此不需要空气过滤器,而且机架部署可以更简单,在其磁盘和服务器刀片连接使技术人员能够快速拆分并将其放在一起。所有这些方便的访问都有额外的费用。

不需要数据中心的工作人员维护可以防止自身的许多问题。“通常在数据中心的维护过程中会发生一些故障。”Cutler说,“如果人们在某个区域工作,通常在一定的时间后开始看到区域的的失败。每当人们触碰到一些东西,都有一些风险,而其他的设备也会受到影响。”

对于某些需要边缘计算的场景,无论是在太空中,在石油钻井平台上还是在矿井下,密封单元看起来都是一个很好的选择。在对石油钻井平台进行地震勘测后通常会将存储在硬盘驱动器上的数TB数据返回总部进行处理。将处理工作量移动到钻机本身可以给出更快的结果。

Cutler说:“海面钻机可能会消失,将成为海床上的自动化平台。但需要更多的计算能力来完成这项工作。”

微软公司和HPE公司正在致力实现太空和海底的数据中心的全面自动化,其技术也可以促进标准的数据中心技术发展,无论是通过自动化和自我修复软件,还是密封单元。Cutler说,微软公司内部的团队已经在考虑如何将Project Natick海底数据中心的应用于设计公司在陆地上的数据中心。“我们将所有这些技术带来微软公司内部的数据中心设计领域,并尝试了解这些技术和应用是否有意义在陆上部署,以带来经济优势,无论是更环保还是成本更低。”


本文转自d1net(转载)

相关文章
|
SQL 关系型数据库 MySQL
远程访问GitLab内置的PostgreSQL数据库
业务系统需要接入GitLab,业务系统以及GitLab都有一套各自的用户系统,需要实现同一套账户密码的话需要将数据同步给GitLab(主要是密码),然而由于GitLab安全策略,通过api进行同步GitLab用户数据并不满足需求,所以需要能直接访问GitLab数据库进行数据修改。
远程访问GitLab内置的PostgreSQL数据库
|
5月前
|
Linux 开发者 Windows
blender-3.3.0-macos-x64安装教程 简单步骤 Mac版 附工具
下载Blender安装包并挂载镜像,将应用拖入“应用程序”文件夹。首次打开时若提示无法验证开发者,需在“系统设置-隐私与安全性”中点击“仍要打开”。启动后即可进入主界面,使用3D视图、属性面板和工具栏进行建模与编辑,轻松开始创作。
|
3月前
|
机器学习/深度学习 自然语言处理 搜索推荐
你的模型真的“懂”吗?用 Captum / SHAP 把神经网络扒开给你看
你的模型真的“懂”吗?用 Captum / SHAP 把神经网络扒开给你看
430 4
|
6月前
|
自然语言处理 物联网 vr&ar
dLLM:复用自回归模型权重快速训练扩散语言模型
dLLM是一个开源Python框架,统一了扩散语言模型的训练、微调、推理与评估流程。它支持将任意自回归大模型(如LLaMA、BERT)转化为扩散模型,提供LoRA、4-bit量化等高效训练能力,并兼容Hugging Face生态。通过Masked Diffusion、Edit Flows等方法,实现文本全局优化生成与编辑,在复杂推理、结构化输出等任务中表现优异,推动扩散语言模型迈向实用化。
547 0
dLLM:复用自回归模型权重快速训练扩散语言模型
|
11月前
|
自然语言处理 前端开发 关系型数据库
反向海淘新篇!Superbuy同款系统来袭
Superbuy淘宝代购集运系统,助力海外用户一站式选购淘宝、天猫、京东等平台商品,支持多语言、多币种、多种支付方式及国际物流跟踪,打造高效便捷的跨境购物体验。
|
存储 SQL 安全
大数据的隐私与安全:你的一举一动,都在“裸奔”?
大数据的隐私与安全:你的一举一动,都在“裸奔”?
406 15
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
892 4
|
机器学习/深度学习 算法
R语言超参数调优:深入探索网格搜索与随机搜索
【9月更文挑战第2天】网格搜索和随机搜索是R语言中常用的超参数调优方法。网格搜索通过系统地遍历超参数空间来寻找最优解,适用于超参数空间较小的情况;而随机搜索则通过随机采样超参数空间来寻找接近最优的解,适用于超参数空间较大或计算资源有限的情况。在实际应用中,可以根据具体情况选择适合的方法,并结合交叉验证等技术来进一步提高模型性能。
1397 5
|
人工智能 供应链 安全

热门文章

最新文章