重磅发布!飞天智算平台+全球最大智算中心

简介: 阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,为科研、公共服务和企业机构,提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,为科研、公共服务和企业机构,提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

我们希望通过开放飞天智算平台,为各行各业提供强大的融合算力、高效的全链路智能服务,同时在可支撑多种指令集芯片的基础上,大幅提升计算效率,并通过绿色低碳方面的能力,大大降低AI训练能耗。为各领域创新提供更高效、更开放、更绿色的智能计算服务。
——阿里云智能全球销售总裁蔡英华

image.png

01
支撑建设超级智算中心

飞天智算平台源于阿里巴巴内部广泛实践,也源于广泛的产业智能实践。目前,该平台正在支撑建设两座超大规模智算中心。

张北智算中心建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力。在云端,张北智算中心支撑AI预训练大模型、AI Earth、数字人等前沿AI应用,将成为全球最大的智算中心。

乌兰察布智算中心建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力,位于“东数西算”内蒙古枢纽节点,采用自然风冷、AI调温等绿色技术,实现绿色低碳。

image.png

02
全面开放飞天智算平台

飞天智算平台是阿里云最新发布的全栈智能计算解决方案,提供公共云和专有云两种模式,为各类科研和智能企业机构提供强大的智能计算服务。

通过先进的技术架构,飞天智算平台实现了90%的千卡并行计算效率,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

突破计算效率极限
飞天智算平台采用先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”,从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

支持“一云多芯”
飞天智算平台提供基于阿里云磐久基础设施的融合算力和大数据AI一体化平台整体解决方案,可以运行在X86、GPU、ARM等多种芯片类型的服务器上,实现“一云多芯”,支持多种处理器混合部署、统一调度,并可进行应用优化,部分性能提升100%以上。

高效智能服务
开发人员可以在飞天智算平台上进行数据存储、数据治理、数据分析、模型开发、模型训练与推理的工作。并提供了预训练模型,以及语音,图像、自然语言处理、决策等领域的模型能力,以方便开发者更好的加速AI应用的开发。

绿色低碳
飞天智算在技术减排、能源结构优化、区域布局优化、供应链减碳以及资源利用优化五个方面来降低单位算力的碳排放。在技术减排方面,通过液冷、电源技术以及智能运维等方式降低能耗,PUE最低可达1.09。

image.png
阿里云浸没式液冷集群

03
体系化的技术创新

智能计算不同于通用型计算,需要海量数据对AI模式进行训练,算力被损耗在数据迁移、同步等环节,千卡以上规模的算力输出最低往往仅有40%左右。这导致了智能算力成本高昂,制约了产业发展。

阿里云通过体系化的技术创新,改变了智能计算的损耗难题,将千卡并行计算效率提升至90%以上。

  • 在网络技术上:阿里云采用高性能RDMA网络,实现端对端最低2微妙延迟。
  • 在通信技术上:阿里云自研的无阻塞通信技术,让计算过程中的数据交换速度提升了5倍以上。
  • 在存储技术上:自研的IO加速器让数据存取实现最高10倍性能提升。
  • 在大数据AI开发层:阿里云提供分布式训练框架,并通过API对分布式策略进行自动组合和调优,将训练效率提升了11倍以上。
  • 一站式AI计算开发服务:阿里云为用户提供了一站式的通用推理优化工具,对算法模型进行量化、剪枝、稀疏化、蒸馏等操作,将推理效率提升6倍以上。

image.png
阿里云飞天智算中心

04
构建智算生态产业圈

如今,飞天智算平台已在阿里内部广泛应用,支撑达摩院前沿AI和电商智能技术发展,并服务了小鹏汽车、深势科技、上汽集团、中国气象局、南方电网等机构和企业,支撑自动驾驶、新药研发、气象预测、工业能源等行业大幅提升AI训练效率。

在自动驾驶领域

小鹏汽车:基于飞天智算在乌兰察布建设智算中心“扶摇”,算力规模达600PFLOPS,是国内最大的自动驾驶智算中心,将自动驾驶模型训练提速近170倍。

毫末汽车:基于飞天智算,实现128卡并行效率超96%,使自动驾驶模型训练成本降低62%,训练速度提升110%,让模型迭代周期大幅缩短。

在生命科学领域

深势科技采用飞天智算平台之后,将集群性能优化提升超过100%,让分子动力学仿真模拟训练效率提升了5倍以上。

在工业领域

智己汽车:运用高性能计算将工业仿真的效率提升了25%,智能驾驶训练效率提升了70%,加速了新车型的研发上市。

山东德州电力:通过AI进行复核预测,准确率达到了98%,耗时从1小时缩短至几分钟。

在城市治理领域

四川成宜高速:通过数字孪生进行车路协同优化使事故率降低60%。

重庆水务:通过遥感数据与仿真推演实现水利调度预测准确性高达95%;

南方电网与中国气象局:利用智算能力提升气象预报的准确性与稳定性。

带你一图看懂
阿里云飞天智算平台
↓↓↓

640.jpeg

文章来源阿里云公众号2022年8月30日发布的《重磅发布!飞天智算平台+全球最大智算中心》

相关文章
|
存储 资源调度 监控
|
人工智能 运维 安全
阿里云飞天企业版“智算升级”,为政企打造AI时代最开放的云
阿里云正式发布飞天智算—飞天企业版V3.18,为政企客户打造AI时代最开放的云。此次升级,飞天企业版将智算能力深度融入云平台,实现“一云多算”,满足政企客户对云平台“云+AI”协同发展需求,为AI技术大规模在政企领域应用做好准备。
1371 11
|
11月前
|
人工智能 Serverless 调度
突破地域限制,实现算力无限供给 —阿里云ACK One注册集群开启多地域Serverless算力调度
本文介绍了阿里云ACK One注册集群多地域Serverless算力调度解决方案,解决传统数据中心在AI时代面临的算力不足问题。方案通过分钟级接入、100%兼容Kubernetes操作及云上Serverless弹性,实现跨地域弹性算力供给,支持高并发请求与模型快速迭代。文中详细描述了快速接入步骤、指定地域调度及动态调度方法,并提供了相关代码示例。该方案助力企业实现AI推理服务的规模化部署,提升商业落地效率。
|
人工智能 算法 芯片
天天都在说的“算力”到底是个啥?一文全讲透!
算力是数字经济发展的重要支撑,尤其在AI和大数据应用中起着关键作用。阿里云致力于构建全球领先的算力基础设施,助力各行业数字化转型。吴泳铭和马云均强调了算力在未来科技竞争中的核心地位。2023年底,我国算力总规模达230EFLOPS,位居全球第二。算力分为通用、智能和超算算力,广泛应用于人工智能训练与推理等场景。中国正加速建设智算中心,推动算力产业链发展,并注重绿色低碳和智能运维,以应对日益增长的计算需求。
21340 19
|
人工智能 运维 网络架构
阿里云引领智算集群网络架构的新一轮变革
11月8日至10日,CCF ChinaNet(中国网络大会)在江苏张家港召开,众多院士、教授和技术领袖共聚一堂,探讨网络未来发展方向。阿里云研发副总裁蔡德忠发表主题演讲,展望智算技术发展趋势,提出智算网络架构变革的新思路,发布高通量以太网协议和ENode+超节点系统规划,引起广泛关注。阿里云HPN7.0引领智算以太网生态蓬勃发展,成为业界标杆。未来,X10规模的智算集群将面临新的挑战,Ethernet将成为主流方案,推动Scale up与Scale out的融合架构,提升整体系统性能。
|
存储 人工智能 安全
AI战略丨全面投入升级 AI 大基建
云厂商拥有全栈技术储备,并通过基础设施的全面升级,让 AI 训练、推理、部署和应用整个生命周期变得更高效。
|
存储 人工智能 对象存储
一文详解阿里云AI大基建
一文详解阿里云AI大基建
2583 2
|
机器学习/深度学习 人工智能 达摩院
飞天 AI 平台重磅发布!阿里拥抱 AI 这五年
2014 年,一个名为“iDST”的神秘部门的诞生开启了阿里的人工智能新征程,5 年后,初长成的达摩院成为了阿里 AI 崛起的代表性力量。如今,阿里已跻身全球人工智能技术研发的第一梯队,成为时下这 AI 技术洪流中不可或缺的力量。这份出彩的“成绩单”背后,是阿里 AI 团队过去 5 年的筹谋、坚守与突破。在杭州召开的阿里巴巴云栖大会上,AI 悄然占据 C 位,新任“阿里云智能计算平台掌门人”贾扬清、阿里巴巴达摩院机器智能实验室负责人金榕、阿里巴巴达摩院语音实验室负责人鄢志杰等三十几位达摩院技术专家在大会第二天发布了阿里在 AI 领域的最新研究进展和成果。
4009 0
飞天 AI 平台重磅发布!阿里拥抱 AI 这五年

热门文章

最新文章