磐久服务器云栖再创新 高密计算和算力原生已成趋势

简介: 2022云栖大会,服务器分论坛精华全分享~

首图-图标.png


【阅读原文】戳:磐久服务器云栖再创新 高密计算和算力原生已成趋势

 

11月3日-5日,2022云栖大会在杭州云栖小镇举行。上千位院士、科学家、学者、行业领军者参与其中,通过两场重磅主论坛、60多场峰会和分论坛,带来关于数字产业和数字技术的1000多个话题分享,碰撞最前沿的技术与思想。

 

作为磐久基础设施的关键资源之一,磐久服务器自去年云栖大会发布以来,在计算架构演进、硬件资源池化和算力原生实践方面也取得了新的突破,在2022云栖大会《从芯到系统的服务器算力创新》分论坛,以及“计算之力”主题展馆磐久基础设施服务器展区,整体展示了服务器部件和架构设计领域最新的技术创新进展。

 

《从芯到系统的服务器算力创新》分论坛从产业和高校技术创新、芯片产业技术创新、服务器技术创新等多个维度,给现场观众带来了当前业界最新的芯片定制、chiplet优化、服务器架构创新最新成果,以及算力原生平台建设领域的实践经验,整体呈现当前数据中心算力提升领域的关键技术,以及未来的发展之路。

 

 

从芯到系统的磐久服务器算力创新核心亮点


1.jpg

Debendra Das Sharma博士

CXL联盟创始人、UCIe董事会Chairperson、Intel资深院士

 

基于芯粒(Chiplet)设计和封装已成为当前芯片设计的必然途径:以智算为代表的高密算力及其高速增长,带来了对芯片晶体管密度进一步增长的强劲需求,而摩尔定律持续放缓又带来了芯片成本高企,严重制约了算力的实现和部署。在这样的背景下,基于芯粒(Chiplet)设计和封装已成为当前芯片设计的必然途径,而硅片间互联则是该芯片设计模式下的关键。UCIe旨在打造业界统一的片间互联技术标准,推动基于硅片的商业化复用,从而打造后摩尔时代低成本、高效互联的芯片设计新范式和商业生态,为高密算力的进一步发展奠定基础。

 

国瑞.jpg

郭锐

阿里云基础设施服务器研发资深技术专家

 

新一代服务器高密度计算架构率先亮相:阿里云服务器持续创新,顺应“双碳”和“一云多芯”趋势,以及CIPU云计算架构带来的革命性变化,率先推出高可用的高密算力集群服务器系统。首先是基于方升架构3.0的高密计算架构,此次推出1U两节点磐久服务器高性能计算系列,未来会推出更高节点密度的系列,计算密度倍数增长,以满足快速增长的业务对高性能算力的需求;其次,通过服务器计算、存储等硬件资源模块化和池化,实现云服务器配置的灵活性及智能化,从而匹配客户的多样化需求;另外,全新推出的支持低碳、环保、高效能的浸没式液冷系统,包含了高功率浸没式Tank,且支持高可靠54V集中供电架构等。

 

1.jpg

孔阳

阿里云基础设施服务器研发高级技术专家

 

高速互联技术CXL在内存池化应用中落地:磐久服务器研发团队推出的基于CXL的机柜内互联方案,以200ns以内的超低延迟,百GB传输带宽,实现计算池、内存池、存储池的机柜池化系统。在数据库内存池化应用场景,支持超大容量TB级共享内存;提供极致的CPU和内存利用率;提高VM/容器发布和迁移效率,可实现秒级迁移,整体效率提升2~3个数量级。极大满足云原生业务对服务器系统极致弹性、资源共享等方面的诉求。

 

 

1-1.jpg

陈文智教授

浙江大学信息技术中心主任

 

云原生的算力助力高校科研创新和学科交叉新模式:“研在浙大”平台是浙大在高校信息化、数字化领域的创新实践标杆,为校内计算、AI等科研提供校内纳管底座和算力资源平台。科研领域的多样性,以及算力硬件的多样化,为“研在浙大”平台的构建带来了许多挑战。浙大计算机系统结构实验室ARCLab联合阿里云探索以算力为中心的计算体系架构演变,尝试通过云原生技术抽象CPU/GPU等硬件算力,构建网上浙大的算力底座,让算力更好地服务浙大科研,让高校信息化走在科技前沿。

 

 

TOM_9219-opq334341333.jpg

王楠

阿里云基础设施服务器研发高级技术专家

 

震旦vODLA为云计算提供标准化、高性能、普惠的异构算力:随着AI、自动驾驶和元宇宙对算力需求的迅速增长,异构算力资源显然已成为云计算最重要的基础设施之一。阿里云震旦vODLA通过面向算力原生的设计,实现了一套集异构算力抽象、度量、调度、使能于一体的技术和能力,通过整合多样化的异构算力资源,为云计算提供标准化、高性能、普惠的异构算力。2022年9月,联手灵骏智算平台,完成了MLPerf™推理榜单网络模式类别的首次提交,第一次以虚拟算力的方式,将此前榜单上最好成绩的24卡GPU算力提升至32卡行业主流GPU算力,突破了系统级PCIe插槽和Pod网络链接数量的物理限制。另外,2022 天猫双十一的首猜场景基于震旦vODLA,达成了性能提升3-5倍。

 

 


红瑞.jpg陈烽

阿里云基础设施供应链资深专家

 

元气.jpg

段光锐

阿里云天基供应链高级专家

 

C2F商业模式让用户直连工厂,创服务器智能智造标杆:阿里云运用智能制造、大数据、边缘计算、运筹优化等相关技术,构建了全自动化的智能工厂,前端商城支持内部用户灵活匹配,供应能力实时可视,需求直达工厂,实现了秒级全链路承诺交期的能力。智能排产采用线边仓储一体化,对物料和资源进行实时动态匹配。自动化模组线采用软件定义产线设计理念,通过云化调度中心对设备与工艺流程进行仿真、统一调度和动态优化,实现柔性化生产4小时下线。

 

 

 

算力原生圆桌论坛


1.jpg

图 |从左到右为:阿里云基础设施服务器研发高级技术专家卢晓伟、Intel数据中心和人工智能事业部首席工程师胡潇、NVIDIA解决方案工程中心高级技术经理路川、瀚博半导体创始人&CTO张磊、登临科技联合创始人& 首席架构师王平、浙江大学信息技术中心主任陈文智教授

 

产业大咖共议高弹性、高适应性和低成本的算力原生,正在让算力资源更加简单、普惠和易用。随着企业数字化和智能化的转型,对于算力的需求越来越大,同时计算硬件也在进行多样化的演进,CPU、GPU、ASIC层出不穷,新硬件为应用带来了创新和算力成本的降低,同时也带来了应用复杂性,需要研发、测试到运维等各个层面的适配和调优,从而带来了人力成本的提升。算力原生技术,依托成熟的云原生技术,提供vXPU算力虚拟化能力,让用户真正面向算力开发应用,而非关注具体的硬件,从而减少专业而复杂的硬件适配成本。

 

此外,本次云栖大会,阿里云与中国移动联合发布了基于震旦vODLA技术的《面向智算的算力原生白皮书》,后续将通过开源开放,持续推动算力原生技术的生态建设,以更加普惠、简单的算力助力企业智能化发展。

 

 

“计算之力”主题展馆,“磐久基础设施”展区服务器最新技术产品展示


 

  • 磐久服务器产品新进展:

从上到下展示为:1U两节点磐久服务器M系列5U OAM模组磐久服务器G系列

 2.png

1.png

  • 自研部件:

从上到下展示为:Alimemory CXL内存、AliFlash Ultrastor SCM和大计算智能网卡EIC

4.png

3.png

5.png

  • 前沿创新研究:

从上到下展示为:共享内存池服务器微型集群Demo及其软硬件架构图

共享内存池服务器微型集群Demo.png

内存池化软硬件系统架构图.png

  • 解决方案:

震旦vODLA算力原生+磐久服务器+灵骏解决方案

前沿创新研究:共享内存池服务器微型集群Demo及其软硬件架构图.png

 

如您对《从芯到系统的服务器算力创新》分论坛的具体内容感兴趣,您还可以点击此处,访问云栖大会官网,观看我们为您准备的精彩回放。

 


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
|
1天前
|
存储 弹性计算 数据挖掘
阿里云服务器ECS经济型e实例与通用算力u1区别、特性优势、使用场景及租赁费用对比
阿里云ECS云服务器的经济型e实例和通用算力型u1实例各有特点。e实例适合个人开发者和小微企业,适用于中小型网站、开发测试和轻量级应用,性价比高。u1实例则更适合中小企业,提供更高的性能和稳定性,适用于企业级应用、数据分析和中小型数据库。同等配置下,u1实例在计算、存储和网络性能上优于e实例。
116 86
|
5月前
|
存储 机器学习/深度学习 人工智能
阿里云服务器计算型c8i与通用型g8i实例规格性能及收费标准与活动价格参考
阿里云服务器计算型c8i与通用型g8i实例是阿里云的第八代云服务器实例规格,是除了计算型c7与c8y和通用型g7与g8y之外同样深受用户喜欢的云服务器实例规格。本文将详细介绍阿里云的计算型c8i和通用型g8i两款云服务器实例,包括它们的技术特性、适用场景、性能优势、最新活动价格情况,以供参考。
阿里云服务器计算型c8i与通用型g8i实例规格性能及收费标准与活动价格参考
|
5月前
|
存储 安全 数据库
阿里云服务器计算型、通用型、内存型主要实例规格性能特点和适用场景汇总
阿里云服务器ECS计算型、通用型、内存型规格族属于独享型云服务器,在高负载不会出现计算资源争夺现象,因为每一个vCPU都对应一个Intel ® Xeon ®处理器核心的超线程,具有性能稳定且资源独享的特点。本文为大家整理汇总了阿里云服务器ECS计算型、通用型、内存型主要实例规格族具体实例规格有哪些,各个实例规格的性能特点和主要适用场景。
阿里云服务器计算型、通用型、内存型主要实例规格性能特点和适用场景汇总
|
1月前
|
弹性计算 双11 开发者
阿里云ECS“99套餐”再升级!双11一站式满足全年算力需求
11月1日,阿里云弹性计算ECS双11活动全面开启,在延续火爆的云服务器“99套餐”外,CPU、GPU及容器等算力产品均迎来了全年最低价。同时,阿里云全新推出简捷版控制台ECS Lite及专属宝塔面板,大幅降低企业和开发者使用ECS云服务器门槛。
157174 23
|
22天前
|
机器学习/深度学习 弹性计算 人工智能
阿里云服务器架构有啥区别?X86计算、Arm、GPU异构、裸金属和高性能计算对比
阿里云ECS涵盖x86、ARM、GPU/FPGA/ASIC、弹性裸金属及高性能计算等多种架构。x86架构采用Intel/AMD处理器,适用于广泛企业级应用;ARM架构低功耗,适合容器与微服务;GPU/FPGA/ASIC专为AI、图形处理设计;弹性裸金属提供物理机性能;高性能计算则针对大规模并行计算优化。
|
1月前
|
弹性计算 大数据 双11
阿里云ECS“99套餐”再升级!双11一站式满足全年算力需求
弹性计算双11爆款清单来袭,感恩回馈好礼,优惠惊喜不断!
|
2月前
|
存储 固态存储 安全
阿里云服务器X86计算架构解析与X86计算架构云服务器收费价格参考
阿里云服务器架构分为X86计算、Arm计算、高性能计算等多种架构,其中X86计算是用户选择最多的一种架构,本文将深入探讨阿里云X86计算架构的云服务器,包括其技术特性、适用场景、性能优势以及最新价格情况。
|
2月前
|
编解码 弹性计算 应用服务中间件
阿里云服务器Arm计算架构解析:Arm计算架构云服务器租用收费标准价格参考
阿里云服务器架构分为X86计算、Arm计算、高性能计算等多种架构,其中Arm计算架构以其低功耗、高效率的特点受到广泛关注。本文将深入解析阿里云Arm计算架构云服务器的技术特点、适用场景以及包年包月与按量付费的收费标准与最新活动价格情况,以供选择参考。
|
2月前
|
机器学习/深度学习 弹性计算 编解码
阿里云服务器计算架构X86/ARM/GPU/FPGA/ASIC/裸金属/超级计算集群有啥区别?
阿里云服务器ECS提供了多种计算架构,包括X86、ARM、GPU/FPGA/ASIC、弹性裸金属服务器及超级计算集群。X86架构常见且通用,适合大多数应用场景;ARM架构具备低功耗优势,适用于长期运行环境;GPU/FPGA/ASIC则针对深度学习、科学计算、视频处理等高性能需求;弹性裸金属服务器与超级计算集群则分别提供物理机级别的性能和高速RDMA互联,满足高性能计算和大规模训练需求。
|
2月前
|
监控 Serverless 云计算
探索Serverless架构:无服务器计算的新纪元
Serverless架构作为云计算的新范式,让开发者无需管理服务器即可构建和运行应用,从而专注于代码开发。其核心优势包括成本效益、自动扩展及高效部署。通过事件驱动模型和微服务部署,开发者按需付费,减少了资源浪费。尽管面临冷启动、状态管理和调试等挑战,Serverless架构仍凭借其高效性与可扩展性展现出广阔的应用前景。流行平台如AWS Lambda、Azure Functions等使其实施更为便捷。