飞天入海的的数据中心-阿里云开发者社区

开发者社区> 知与谁同> 正文

飞天入海的的数据中心

简介:
+关注继续查看

日前,向国际空间站补给物资的Space X Dragon飞船带来了一些新的东西:第一台飞往太空的商业电脑。通常,用于太空任务的计算机是专门设计的,可承受从飞船起飞的超重力到零重力,以及宇宙辐射的所有方面严苛的考验。而地球的上数据中心的服务器却不能承受这样的环境。Hewlett Packard Enterprise公司去年收购超级计算机供应商SGI公司,该公司首席技术官EngGoh博士说,可以进行太空旅行的加强计算机的推出可能需要数年时间。

  Space X Dragon航天器2016年4月经过迪拜上空

Goh在接受行业媒体采访时表示:“人们花了很长的时间来强化在这些恶劣的空间环境中使用的电脑,但这些电脑比较老旧,因此性能差距很大。对于某些任务来说,可能会花费更多的时间来强化系统,而不是强化使用。”然而,专门的一次性硬件的成本是很昂贵的,通常不会获得规模经济技术通常提供的优势。

Goh希望为宇航员提供最新的可用硬件,能够加载通用计算程序的标准软件,以及智能的自适应控制,将系统强化的负担从硬件转移到软件。HPE公司发送到空间站的两台水冷Apollo40已经运行了一年,这两台服务器从工厂生产出来时,并没有对硬件进行强化,进入太空轨道后,通过了NASA测试,不需要修改,这意味着其服务器应该在其他恶劣的环境也会运行得很好。

像Goh所说的那样,太空的服务器是一个实验,可以发现太空中的恶劣环境对未强化硬件的影响,以及在软件中可以做些什么来减少这种影响。这个想法是在检测到更高级别的操作时,减少服务器的功耗和运行速度,看看是否足以使它们运行。“可以使用软件来硬化计算机吗?这就是我们想要得到回答的问题。”

数据中心行业标准机构Uptime Institute研究所首席技术官Christopher Brown表示,困难环境的强化系统正在成为一个更主流的问题。随着社会越来越依赖计算和通信技术,卫星通信,GPS,计算机辅助飞机导航等,这种研究在几个小众领域用之外的地方越来越相关。Brown说,“真正超越了非常专业化的人员和群体的边缘,在某种程度上它会影响到所有的人。”

太空和地球上的计算机的经验教训

Space X Dragon飞船上的服务器位于与电源,以太网和冷冻水系统相连的储物柜中。这个方便的储物柜不是为了保护机器而设计的,则只是为了存储它们。服务器部署了SSD硬盘,不会受到零重力和电离辐射影响,安装了体积较小的快速驱动器和运行较慢的驱动器,以便在太空中更好地工作。此外还有Infiniband互连,因为铜连接可能比光纤更容易受辐射影响。该团队没有调查CPU,内存和SSD参数,而服务器运行在标准版本的RHEL 6.8操作系统中。

通用服务器将对未来的宇航员有用,因此像HPE这样的公司,这是一个有趣的潜在增长市场。Goh指出,“如果商业太空旅行与航空旅行相同,那么其市场并不小,探索空间也是人们真正需要边缘计算的地方。如果我们向火星派遣一支远征队,那么20分钟的延迟将意味着地球的系统不适合任何实时处理,如图像识别或预测分析。”

但而从太空应用得来的经验教训在地球上的应用也是有用的。HPE公司希望把它学到的东西应用到恶劣的地球环境中,并通常教电脑来更好地照顾自己。Goh说:“更高层次的目标是让计算机能够通过传感器和预警系统来适应自己的环境如今,人们为反病毒预留了一些计算周期;还应该留出周期让计算机自己照顾自己,保护自己。如果你说每秒有10亿次操作,那么人们愿意为防病毒预留0.5%,那么是否可以提供5%到8%给自我护理?”

微软在另一个极端环境中的探索

这些目标与微软公司Project Natick的目标相似。当微软公司的研究人员从微软Azure数据中心将一个42U机架的服务器内罩上一个密封的外壳,并将其沉入离岸边半英里的海底沉没时,其中的一个目标是学习如何在任何环境加速部署数据中心。

“如今,部署一个大型数据中心需要很长时间,”Natick项目研究人员Ben Cutler表示,“可能需要两年时间,因为企业必须找到一些地方来部署数据中心,首先必须获得建设数据中心的土地,必须得到许可证,建设建筑。即使拥有各种各样的千篇一律的数据中心,仍然要面对这样一个事实:土地不同,气候不同,工作规则和建筑规范都不同,电力的来源是不同的。此外,还需要很长时间。”

有时云端服务需求在一个意想不到的地方出现了高峰,而微软公司希望尽可能快地做出回应,Cutler继续说道,“我们的目的是在90天内完成数据中心计划到运营,是否可以达到在世界任何地方规模化部署数据中心的能力?”

  微软试验性水下数据中心Project Natick正在在加利福尼亚沿岸部署

出于同样的原因,微软公司开发了在新的Azure数据中心直接安装并完全部署的机架。Cutler指出:“我们通常不会做的事情是将建筑视为制成品。采用笔记本电脑或手机,人们几乎完全知道如何运作,以及在构建之前花费多少钱,你可以快速得到一个数据中心,因为在你订购时,它被拉出机架并运送到某个地方。我们想要在数据中心方面做出同样的事情。”

设计用于人工操作

海洋并没有像太空那样苛刻的环境,但它比陆地湿润,并会遭遇飓风,温度波动等恶劣天气和环境。这意味着从长远来看,在水下可靠运行的数据中心的成本将会比陆地上的数据中心成本更低。一方面,其冷却成本是目前冷却成本的20%。Cutler表示,如今的数据中心主要依靠空气冷却,这意味着它们比较温暖。“我们的假设是,如果IT设备环境的温度一直很低,那么失败率也会更低。”

服务器故障率在这里具有一个全新的层次。水下数据中心将是密封单元,其设计为在维护服务器的五年甚至十年的整个工作期间无需维护。“从历史上看,如果每年都会有对服务器进行更新,故障率并不重要,”Cutler说。然而,如今的硬件并没有像以前那样快速地更新硬件,而是可以在更长的时间内运行硬件来降低成本。

但水下数据中心没有人能够进入进行维修,Natick数据中心内充满了氮气其,内部几乎没有湿度,其湿度对硬盘来说并不全是坏处,数据中心故障的主要原因之一是电子设备中连接部分的腐蚀。随着时间的推移,湿气会导致设备中两个金属片之间短路,最终导致故障。但也不能使空气太干燥,因为某些硬盘驱动器会使用电机润滑脂和一些水分。如果低于10%的湿度,那么这些润滑油脂就会变成粉末,就会出现另一种故障。”

密封的机架可以消除灰尘问题,因此不需要空气过滤器,而且机架部署可以更简单,在其磁盘和服务器刀片连接使技术人员能够快速拆分并将其放在一起。所有这些方便的访问都有额外的费用。

不需要数据中心的工作人员维护可以防止自身的许多问题。“通常在数据中心的维护过程中会发生一些故障。”Cutler说,“如果人们在某个区域工作,通常在一定的时间后开始看到区域的的失败。每当人们触碰到一些东西,都有一些风险,而其他的设备也会受到影响。”

对于某些需要边缘计算的场景,无论是在太空中,在石油钻井平台上还是在矿井下,密封单元看起来都是一个很好的选择。在对石油钻井平台进行地震勘测后通常会将存储在硬盘驱动器上的数TB数据返回总部进行处理。将处理工作量移动到钻机本身可以给出更快的结果。

Cutler说:“海面钻机可能会消失,将成为海床上的自动化平台。但需要更多的计算能力来完成这项工作。”

微软公司和HPE公司正在致力实现太空和海底的数据中心的全面自动化,其技术也可以促进标准的数据中心技术发展,无论是通过自动化和自我修复软件,还是密封单元。Cutler说,微软公司内部的团队已经在考虑如何将Project Natick海底数据中心的应用于设计公司在陆地上的数据中心。“我们将所有这些技术带来微软公司内部的数据中心设计领域,并尝试了解这些技术和应用是否有意义在陆上部署,以带来经济优势,无论是更环保还是成本更低。”


本文转自d1net(转载)

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
AI加持的阿里云飞天大数据平台技术揭秘
摘要:2019云栖大会大数据&AI专场,阿里云智能计算平台事业部研究员关涛、资深专家徐晟来为我们分享《AI加持的阿里云飞天大数据平台技术揭秘》。本文主要讲了三大部分,一是原创技术优化+系统融合,打破了数据增长和成本增长的线性关系,二是从云原生大数据平台到全域云数仓,阿里开始从原生系统走入到全域系统模式,三是大数据与AI双生系统,讲如何更好的支撑AI系统以及通过AI系统来优化大数据系统。
7495 0
胖子哥的大数据之路(一)-数据仓库也需要大数据
一、楔子   大数据传统企业实施,其路漫漫,绝不会如昙花一现,探索大数据在传统行业的实施之路,寻找一条适合传统行业的企业大数据实施方法体系,是我执着坚守的信念,大数据是一种信仰,吾将上下而求索。记下项目中的点滴,算是日志,自勉。
803 0
胖子哥的大数据之路(8)- 数据仓库命名规范
引言:   从对大数据的狂热到理性的回归,项目实施起到了醍醐灌顶的作用,大数据技术只能作为一种IT基础架构(存储+运算),而实际的工程化实施,还是要回归到IT传统技术,最近在整合大数据时代的数据仓库框架,希望能有更多的人参与进来。
801 0
阿里云服务器端口号设置
阿里云服务器初级使用者可能面临的问题之一. 使用tomcat或者其他服务器软件设置端口号后,比如 一些不是默认的, mysql的 3306, mssql的1433,有时候打不开网页, 原因是没有在ecs安全组去设置这个端口号. 解决: 点击ecs下网络和安全下的安全组 在弹出的安全组中,如果没有就新建安全组,然后点击配置规则 最后如上图点击添加...或快速创建.   have fun!  将编程看作是一门艺术,而不单单是个技术。
3975 0
使用OpenApi弹性释放和设置云服务器ECS释放
云服务器ECS的一个重要特性就是按需创建资源。您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源。本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置。
7630 0
老司机的 redis 数据迁移笔记
老服务器上内存一直报警,所以要把一部分redis数据迁移到新服务器上去。 迁移的方式有两种,一种是停服务器,搬迁数据;另一种通过主从同步转移。 停服务器,搬迁数据 首先在原服务器上执行redis-cli shutdown命令,该命令会触发保证写RDB文件以及将AOF文件写入磁盘,不会丢失数
14748 0
阿里巴巴飞天大数据平台MaxCompute(原名ODPS)全套攻略(持续更新20200109)
10年老兵带你看尽MaxCompute大数据运算挑战与实践
119032 0
+关注
10077
文章
2994
问答
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载