磐久服务器云栖再创新 高密计算和算力原生已成趋势

简介: 2022云栖大会,服务器分论坛精华全分享~

首图-图标.png


【阅读原文】戳:磐久服务器云栖再创新 高密计算和算力原生已成趋势

 

11月3日-5日,2022云栖大会在杭州云栖小镇举行。上千位院士、科学家、学者、行业领军者参与其中,通过两场重磅主论坛、60多场峰会和分论坛,带来关于数字产业和数字技术的1000多个话题分享,碰撞最前沿的技术与思想。

 

作为磐久基础设施的关键资源之一,磐久服务器自去年云栖大会发布以来,在计算架构演进、硬件资源池化和算力原生实践方面也取得了新的突破,在2022云栖大会《从芯到系统的服务器算力创新》分论坛,以及“计算之力”主题展馆磐久基础设施服务器展区,整体展示了服务器部件和架构设计领域最新的技术创新进展。

 

《从芯到系统的服务器算力创新》分论坛从产业和高校技术创新、芯片产业技术创新、服务器技术创新等多个维度,给现场观众带来了当前业界最新的芯片定制、chiplet优化、服务器架构创新最新成果,以及算力原生平台建设领域的实践经验,整体呈现当前数据中心算力提升领域的关键技术,以及未来的发展之路。

 

 

从芯到系统的磐久服务器算力创新核心亮点


1.jpg

Debendra Das Sharma博士

CXL联盟创始人、UCIe董事会Chairperson、Intel资深院士

 

基于芯粒(Chiplet)设计和封装已成为当前芯片设计的必然途径:以智算为代表的高密算力及其高速增长,带来了对芯片晶体管密度进一步增长的强劲需求,而摩尔定律持续放缓又带来了芯片成本高企,严重制约了算力的实现和部署。在这样的背景下,基于芯粒(Chiplet)设计和封装已成为当前芯片设计的必然途径,而硅片间互联则是该芯片设计模式下的关键。UCIe旨在打造业界统一的片间互联技术标准,推动基于硅片的商业化复用,从而打造后摩尔时代低成本、高效互联的芯片设计新范式和商业生态,为高密算力的进一步发展奠定基础。

 

国瑞.jpg

郭锐

阿里云基础设施服务器研发资深技术专家

 

新一代服务器高密度计算架构率先亮相:阿里云服务器持续创新,顺应“双碳”和“一云多芯”趋势,以及CIPU云计算架构带来的革命性变化,率先推出高可用的高密算力集群服务器系统。首先是基于方升架构3.0的高密计算架构,此次推出1U两节点磐久服务器高性能计算系列,未来会推出更高节点密度的系列,计算密度倍数增长,以满足快速增长的业务对高性能算力的需求;其次,通过服务器计算、存储等硬件资源模块化和池化,实现云服务器配置的灵活性及智能化,从而匹配客户的多样化需求;另外,全新推出的支持低碳、环保、高效能的浸没式液冷系统,包含了高功率浸没式Tank,且支持高可靠54V集中供电架构等。

 

1.jpg

孔阳

阿里云基础设施服务器研发高级技术专家

 

高速互联技术CXL在内存池化应用中落地:磐久服务器研发团队推出的基于CXL的机柜内互联方案,以200ns以内的超低延迟,百GB传输带宽,实现计算池、内存池、存储池的机柜池化系统。在数据库内存池化应用场景,支持超大容量TB级共享内存;提供极致的CPU和内存利用率;提高VM/容器发布和迁移效率,可实现秒级迁移,整体效率提升2~3个数量级。极大满足云原生业务对服务器系统极致弹性、资源共享等方面的诉求。

 

 

1-1.jpg

陈文智教授

浙江大学信息技术中心主任

 

云原生的算力助力高校科研创新和学科交叉新模式:“研在浙大”平台是浙大在高校信息化、数字化领域的创新实践标杆,为校内计算、AI等科研提供校内纳管底座和算力资源平台。科研领域的多样性,以及算力硬件的多样化,为“研在浙大”平台的构建带来了许多挑战。浙大计算机系统结构实验室ARCLab联合阿里云探索以算力为中心的计算体系架构演变,尝试通过云原生技术抽象CPU/GPU等硬件算力,构建网上浙大的算力底座,让算力更好地服务浙大科研,让高校信息化走在科技前沿。

 

 

TOM_9219-opq334341333.jpg

王楠

阿里云基础设施服务器研发高级技术专家

 

震旦vODLA为云计算提供标准化、高性能、普惠的异构算力:随着AI、自动驾驶和元宇宙对算力需求的迅速增长,异构算力资源显然已成为云计算最重要的基础设施之一。阿里云震旦vODLA通过面向算力原生的设计,实现了一套集异构算力抽象、度量、调度、使能于一体的技术和能力,通过整合多样化的异构算力资源,为云计算提供标准化、高性能、普惠的异构算力。2022年9月,联手灵骏智算平台,完成了MLPerf™推理榜单网络模式类别的首次提交,第一次以虚拟算力的方式,将此前榜单上最好成绩的24卡GPU算力提升至32卡行业主流GPU算力,突破了系统级PCIe插槽和Pod网络链接数量的物理限制。另外,2022 天猫双十一的首猜场景基于震旦vODLA,达成了性能提升3-5倍。

 

 


红瑞.jpg陈烽

阿里云基础设施供应链资深专家

 

元气.jpg

段光锐

阿里云天基供应链高级专家

 

C2F商业模式让用户直连工厂,创服务器智能智造标杆:阿里云运用智能制造、大数据、边缘计算、运筹优化等相关技术,构建了全自动化的智能工厂,前端商城支持内部用户灵活匹配,供应能力实时可视,需求直达工厂,实现了秒级全链路承诺交期的能力。智能排产采用线边仓储一体化,对物料和资源进行实时动态匹配。自动化模组线采用软件定义产线设计理念,通过云化调度中心对设备与工艺流程进行仿真、统一调度和动态优化,实现柔性化生产4小时下线。

 

 

 

算力原生圆桌论坛


1.jpg

图 |从左到右为:阿里云基础设施服务器研发高级技术专家卢晓伟、Intel数据中心和人工智能事业部首席工程师胡潇、NVIDIA解决方案工程中心高级技术经理路川、瀚博半导体创始人&CTO张磊、登临科技联合创始人& 首席架构师王平、浙江大学信息技术中心主任陈文智教授

 

产业大咖共议高弹性、高适应性和低成本的算力原生,正在让算力资源更加简单、普惠和易用。随着企业数字化和智能化的转型,对于算力的需求越来越大,同时计算硬件也在进行多样化的演进,CPU、GPU、ASIC层出不穷,新硬件为应用带来了创新和算力成本的降低,同时也带来了应用复杂性,需要研发、测试到运维等各个层面的适配和调优,从而带来了人力成本的提升。算力原生技术,依托成熟的云原生技术,提供vXPU算力虚拟化能力,让用户真正面向算力开发应用,而非关注具体的硬件,从而减少专业而复杂的硬件适配成本。

 

此外,本次云栖大会,阿里云与中国移动联合发布了基于震旦vODLA技术的《面向智算的算力原生白皮书》,后续将通过开源开放,持续推动算力原生技术的生态建设,以更加普惠、简单的算力助力企业智能化发展。

 

 

“计算之力”主题展馆,“磐久基础设施”展区服务器最新技术产品展示


 

  • 磐久服务器产品新进展:

从上到下展示为:1U两节点磐久服务器M系列5U OAM模组磐久服务器G系列

 2.png

1.png

  • 自研部件:

从上到下展示为:Alimemory CXL内存、AliFlash Ultrastor SCM和大计算智能网卡EIC

4.png

3.png

5.png

  • 前沿创新研究:

从上到下展示为:共享内存池服务器微型集群Demo及其软硬件架构图

共享内存池服务器微型集群Demo.png

内存池化软硬件系统架构图.png

  • 解决方案:

震旦vODLA算力原生+磐久服务器+灵骏解决方案

前沿创新研究:共享内存池服务器微型集群Demo及其软硬件架构图.png

 

如您对《从芯到系统的服务器算力创新》分论坛的具体内容感兴趣,您还可以点击此处,访问云栖大会官网,观看我们为您准备的精彩回放。

 


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
7月前
|
存储 机器学习/深度学习 弹性计算
阿里云服务器ECS计算型c9i规格族性能与特点、配置性能参数表
阿里云ECS计算型c9i实例基于Intel® Xeon® Granite Rapids处理器,主频3.2GHz,全核睿频3.6GHz,提供稳定高性能计算能力。支持NVMe协议、vTPM安全加密,适用于机器学习、大数据分析、高性能计算等场景,具备高安全、低延迟、强扩展等优势。
|
10月前
|
开发框架 人工智能 Java
破茧成蝶:阿里云应用服务器让传统 J2EE 应用无缝升级 AI 原生时代
本文详细介绍了阿里云应用服务器如何助力传统J2EE应用实现智能化升级。文章分为三部分:第一部分阐述了传统J2EE应用在智能化转型中的痛点,如协议鸿沟、资源冲突和观测失明;第二部分展示了阿里云应用服务器的解决方案,包括兼容传统EJB容器与微服务架构、支持大模型即插即用及全景可观测性;第三部分则通过具体步骤说明如何基于EDAS开启J2EE应用的智能化进程,确保十年代码无需重写,轻松实现智能化跃迁。
748 42
|
7月前
|
人工智能 编解码 安全
阿里云服务器计算型c7、c8a、c8y、c8i、c9i实例区别及选型指南参考
在阿里云的活动中,属于计算型实例的通常有计算型c7、计算型c8a、计算型c8y、计算型c8i和计算型c9i这几个实例规格,不同实例规格在处理器架构、存储技术、网络协议、安全特性等性能并不是一样的,所以他们的适用场景也有所差异。本文为大家介绍计算型c7、c8a、c8y、c8i、c9i实例的性能、适用场景的区别以及选择参考。
|
9月前
|
存储 弹性计算 缓存
阿里云服务器ECS经济型、通用算力、计算型、通用和内存型选购指南及使用场景分析
本文详细解析阿里云ECS服务器的经济型、通用算力型、计算型、通用型和内存型实例的区别及适用场景,涵盖性能特点、配置比例与实际应用,助你根据业务需求精准选型,提升资源利用率并降低成本。
568 3
|
10月前
|
存储 机器学习/深度学习 网络协议
阿里云服务器计算型实例怎么选择?计算型c7、c8y 、c8i性能评测与选择参考
如果我们通过阿里云目前的活动选择计算型实例规格的云服务器,主要有计算型c7、计算型c8y和计算型c8i实例可选。本文将从实例规格、CPU与内存配置、计算性能、存储与网络能力,以及价格等多个维度,对比分析计算型c7、计算型c8y和计算型c8i实例,为用户提供全面的选择参考。
|
11月前
|
存储 人工智能 边缘计算
当 AI 进入「算力密集时代」:你的服务器能跑通大模型吗?
本文深入探讨AI服务器在技术落地中的核心瓶颈问题,结合实战经验解析从模型训练到端侧部署的算力优化策略。内容涵盖三大典型场景的算力需求差异、GPU服务器选型的五大反直觉真相、实战优化方法(如混合精度训练与硬件资源监控),以及边缘AI部署挑战和解决方案。同时提供算力弹性扩展策略、模型生命周期管理及合规性建议,帮助读者构建可持续发展的算力体系。文末附有获取更多资源的指引。
930 17
|
10月前
|
存储 机器学习/深度学习 安全
阿里云服务器计算型c8i与通用型g8i实例性能、适用场景及价格参考
阿里云不断推陈出新,致力于为用户提供高性能、高可靠性和高安全性的云服务器实例,以满足不同用户在各种复杂场景下的需求。其中,计算型c8i与通用型g8i实例凭借其卓越的性能和灵活的配置,成为了企业级用户的热门选择。本文将深入探讨这两款实例的性能特点、最新收费标准以及适用场景和活动价格情况,以供大家了解和选择。
|
12月前
|
存储 分布式计算 监控
阿里云服务器实例经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i详解与选择策略
在阿里云现在的活动中,可选的云服务器实例规格主要有经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i实例,虽然阿里云在活动中提供了多种不同规格的云服务器实例,以满足不同用户和应用场景的需求。但是有的用户并不清楚他们的性能如何,应该如何选择。本文将详细介绍阿里云服务器中的经济型e、通用算力型u1、计算型c8i、通用型g8i、内存型r8i实例的性能、适用场景及选择参考,帮助用户根据自身需求做出更加精准的选择。

热门文章

最新文章