会 | 迈向算力时代 阿里云基础设施亮相首届中国算力大会

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: “智能计算服务+硬核技术+绿色低碳”的算力基础设施

首图-图标.png


【阅读原文】戳:会 | 迈向算力时代 阿里云基础设施亮相首届中国算力大会


尼葛洛庞帝曾在《数字化生存》一书中预测:计算不再只与计算有关,它决定我们的生存。作为新型生产力,应用在整个算力产业中扮演怎样的角色?不断井喷的算力需求与资源建设的不匹配如何弥合?从计算到超算到智算,如何发挥算力价值?在近日举行的 “2022中国算力大会”上,阿里云基础设施亮相两大分论坛,入选 “创新先锋”优秀成果并集中展示,交出了一份如何构建计算高效、低碳绿色的算力基础设施的丰富答卷。


中国工程院院士、阿里云创始人王坚:云计算是数字经济的基础,过去,云计算促动了传统IT转型,今天,云计算促动了算力经济的发展。


1.jpg

图 | 中国工程院院士、阿里云创始人王坚


论:应用导向,牵引算力科学发展


算力很热,据工信部,截至2021年底,我国算力总规模超过140EFlops,全国智算中心超过20个,从东到西,各类智算中心遍地开花。但如何建好、用好、管好算力,让需求和实际算力资源匹配,阿里云大计算产品研发负责人曹政认为“要坚持以应用为中心,充分发挥应用和平台的能力,通过软件和服务,让算力充分消化,真正作用于实体经济和数字经济。


在“智能凝聚新动力,算力开创新未来”分论坛,曹政分享了与机器学习平台PAI联合打造的阿里云智能计算服务,核心技术源自于阿里云数年来内外部应用场景的沉淀,以大数据AI一体化平台和高效智能算力,解决客户在效率、性能和利用率上的瓶颈。智能计算是一个复合的需求,它耦合了人工智能、大数据、HPC等多应用领域的多元化计算能力。未来,阿里将继续通过底层能力、平台能力、上层应用的建设,配合“东数西算”工程,促进算力更好地为数字经济服务,助力高质量发展。


ZHAO6106-opq285204196.jpg

图 | 阿里云大计算产品研发负责人曹政


就在算力大会刚结束的8月2日,阿里云和小鹏汽车宣布在内蒙古乌兰察布建成中国最大的自动驾驶智算中心“扶摇”,用于自动驾驶模型训练。“扶摇”基于阿里云智能计算平台,算力可达600PFLOPS每秒浮点运算60亿亿次),将小鹏自动驾驶核心模型的训练速度提升了近170倍


003.jpg

图 |  在内蒙古乌兰察布建成中国最大的自动驾驶智算中心“扶摇”


今天,节能减排已成为算力提升进程中绕不开的话题。目前,数据中心的能耗大概占全社会能耗的2%,低碳绿色、科学规划、数字运营是衡量算力基础设施“健康”的重要标准。


在“新型低碳可持续,绿色领跑高质量”分论坛,阿里云基础设施数据中心研究员曲海峰分享了阿里云基础施在低碳绿色方面的典型实践,“通过自研技术创新、科学规划数据中心布局、优化用能结构等多种方式”,阿里云基础设施为云计算注入更多绿色动能。自研技术以碳中和为根本,推动液冷、服务器、网络等自研技术减碳;布局上以乌兰察布、成都、张家口、河源作为中西部枢纽,引导公有云用户向西部迁移。在用能结构上,2021年绿电交易量位列2021“中国绿电采购企业排行榜”第一,2024年以前以绿电交易为主,推动和落地可再生能源自主项目。随着“东数西算”及“双碳”政策的逐步推进,未来阿里云将充分发挥基础设施的作用支撑算力布局与发展。


2.jpg

图 | 阿里云基础设施数据中心研究员曲海峰



奖:首获两项“创新先锋”优秀成果


在30日下午的“创新先锋”优秀成果发布环节,阿里云全浸没式液冷解决方案和震旦异构计算平台分别入选低碳类和系统类“创新先锋”优秀成果

1 (3).png

系统创新:震旦异构计算平台

为数据中心、边缘计算和AIoT等全场景下各种机器学习算法、应用、和高性能计算设计的统一编译和软硬协调优化软件,可实现与各种加速硬件的高效集成和平滑迁移,快速对接上层多种机器学习框架,实现无感知多端快速部署,提升开发效率。


低碳:阿里云全浸没式液冷解决方案

入选的浸没式液冷解决方案开创性地将服务器浸泡在绝缘冷却液里,产生的热量可直接被冷却液吸收进入外循环冷却,全程用于散热的能耗几乎为零,服务器散热不再需要风扇、空调、冷机部件的使用。


推荐阅读:首届中国算力大会,我们在这里!



展:智算+硬核+绿色


在大会同期举办的创新成果展中,阿里云基础设施首次从“智能计算服务、硬核技术、绿色低碳”三个不同维度综合展现了技术领先、算力高效、绿色节能的算力基础设施。


首次展出的阿里云“智能计算服务”源于阿里云服务集团内外不同的应用实践,可满足多种计算密集场景的算力需求。结合机器学习平台PAI,可为开发者和企业提供模型构建、训练、推理等全生命周期服务,可满足自动驾驶、科研、金融、生物制药等行业的多元化算力需求,为用户提供低门槛、高效率的云原生AI工程化能力。


2MXH5794.jpg

图 | 阿里云智能计算服务


在硬核技术展区,磐久服务器M系列和磐久网络联袂以硬件呈现。2021年云栖大会上,磐久服务器首次发布。其中磐久服务器M系列搭载倚天710与阿里自研国产部件的高端机架式服务器,多核高算的特性在面向大型互联网算力密集型等应用时具有突出表现,已经过双11和阿里云实践验证,对服务器有苛刻要求的电信、金融、互联网、大型企业等场景尤为适用。


2MXH5783.jpg

图 | 磐久服务器M系列


磐久可预期网络是以应用为中心,通过阿里云全栈自研+端网融合技术实现的高性能可预期网络系统。整个系统通过阿里云自研交换机、自研网卡以及自研高性能网络协议栈,打造了一个硬核的技术底座,并通过创新性的端网融合技术将各个自研组件进行高效协同,在性能、稳定性、规模等方面均实现了极大提升,为阿里云的超大规模计算、存储集群提供了一个坚实网络底座。


2MXH4988.jpg

图 | 磐久可预期网络


在低碳绿色展区,磐久液冷智算一体机模型吸引不少关注。磐久液冷智算一体机单机柜最高功率可达100KW、40P算力峰值,针对高性能计算、AI训练等场景进行端到端的全系统架构优化设计,可最大程度发挥AI/HPC集群算力峰值。在超高密集群规模下仍保持算力的线性、稳定、持续输出,系统年均PUE低至1.09。2021年底,阿里云正式向业界发布首款单相浸没液冷产品,将绿色液冷技术与极致算力平台结合,实现基础设施散热能力和服务器、网络设备高效融合并整体交付,整体能耗可下降34.6%


111.png

图 | 磐久液冷智算一体机模型


正如1914年开凿完成的巴拿马运河极大地缩短了太平洋和大西洋之间的航程,阿里云自研的10kV交流输入的直流不间断电源系统将中压10kV AC直转240V DC,让供电传输一步到位,减少了系统66%的配电环节,相比传统方式提升效率超过3%至97.5%。该设备已入围2021年《国家通信业节能技术产品推荐目录》,行业标准YD/T 4006-2022《信息通信用10kV交流输入的直流不间断电源系统》已于2022年7月正式发布执行。


2MXH5789.jpg

图 | 巴拿马电源(如上)和数据中心能源与碳化管理平台(如下)


此外,展出的数据中心能源与碳管理平台是国内互联网行业首个能源与碳一体化管理平台,通过IOT、大数据、AI等技术,可准确预测年度、月度用电量,同时联合第三方权威认证机构将碳减排、“碳中和”工作线上化,一键生成报告,实现了“量价费碳”四位一体和实时联动,从而实现以城市、机房、服务器等多维度的碳排放数字化和智能化管理。


↓↓ 展区图集 ↓↓

7D67638F-0554-48D2-9309-A26E7B7694E9-2251-0000127F141FCAE1.jpg 351421E7-8EB9-4EC9-B7F2-237A6C5703C0.png 2MXH5206.jpg 1MXH2666.jpg 1MXH2673.jpg 1FE0A65A-C58C-47F4-8452-AD14A9091F68-26639-00001520511AEF3B.jpg 2MXH5044.jpg 2MXH5564.JPG


今天,“智能敏捷、绿色安全”已成为算力发展新要求。算力智能化、算力绿色化、算力可信化成为未来发展方向。伴随数字世界和物理世界的边界逐步消融,人工智能将从无人驾驶、工业互联网等上层应用向底层基础设施蔓延,赋予算力无处不在价值,不再是单纯算力本身,而是算力基础设施、确定性的算力网络和数据的高效流动及相互融合之后带来的算力服务化趋势。阿里云基础设施将结合自身实际,根植应用,持续自研,为数字经济的加速提供低碳绿色、算力高效、稳定安全的算力基础设施服务!



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
存储 人工智能 运维
重磅发布!飞天智算平台+全球最大智算中心
阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,为科研、公共服务和企业机构,提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
8298 1
重磅发布!飞天智算平台+全球最大智算中心
|
6月前
|
人工智能 云计算
阿里云产品手册2025版发布
阿里云产品手册2025版发布,涵盖阿里云产品大图、面向 AI 的全栈云计算产品体系等最新内容,囊括了阿里云产品介绍、优势、功能、应用场景和发展历程的介绍。
584 12
|
9月前
|
人工智能 网络协议 数据中心
阿里云基础设施网络2024年创新总结
本文将盘点阿里云基础设施网络团队2024年在AI时代可预期网络的技术突破、学术成果、开源生态共建与重要会议技术布道等,与业界同仁一同探讨和展望AI时代的网络技术发展热点和趋势。
阿里云基础设施网络2024年创新总结
|
存储 人工智能 运维
阿里云首款单相浸没液冷解决方案正式对外发布!
阿里云首款单相浸没液冷解决方案正式对外发布!
阿里云首款单相浸没液冷解决方案正式对外发布!
|
12月前
|
人工智能 运维 关系型数据库
携手UALink,阿里云磐久AI Infra 2.0服务器亮相2024 OCP全球峰会
阿里云服务器研发受邀和UALink联盟一起,在OCP全球峰会上重点阐述AI服务器Scale UP互连技术领域发展趋势
|
缓存 人工智能 数据中心
全球光通信顶会OFC2023 阿里云多位专家分享数据中心光网络创新
全球光通信顶会OFC2023 阿里云多位专家分享数据中心光网络创新
全球光通信顶会OFC2023 阿里云多位专家分享数据中心光网络创新
|
运维 大数据 调度
绿色低碳“源动力”,助推中国数智产业高质量发展
绿色低碳“源动力”,助推中国数智产业高质量发展
绿色低碳“源动力”,助推中国数智产业高质量发展
|
芯片 关系型数据库
工程师首选:USB过压保护OVP芯片,40V-70V耐压,电流0.5A-6A
平芯微推出一系列集成保护功能的电源管理芯片,包括PW2605、PW2606B、PW2606、PW2609A、PW1600、PW1515、PW1605、PW1558A、PW2601、PW1555A、PW4054H、PW4057H和PW4056HH。这些芯片具备输入过压关闭保护,防止高压输入损坏电路,并提供不同电流等级的输出支持,部分型号还具有可调限流和内置LDO功能。产品适用于各种应用场景,如磁吸充电线、锂电池充电等。其中,PW系列芯片的过压保护点可调,且部分型号具有高耐压特性,以增强系统安全性。
|
存储 机器学习/深度学习 搜索推荐
long long类型介绍
long long类型介绍
|
存储 边缘计算 运维
阿里云全球基础设施布局与基础设施科技创新介绍
本文介绍了阿里云全球基础设施布局与基础设施科技创新,包含公共云地域、超级数据中心、基础设施四层形态、数据中心、服务器、网络、解决方案科技创新专题等内容。
1946 0
阿里云全球基础设施布局与基础设施科技创新介绍