2月23-24日,阿里云计算巢加速器活动在杭州·阿里巴巴云谷园区举行,40多位计算巢加速器成员企业代表到场参会,与阿里云、AMD以及投资机构等专家展开了为期两天的合作共创。阿里云计算巢加速器成员企业覆盖软件、大数据、生命科学、隐私计算、AI等多个领域,总估值超过600亿。
优质平台的搭建往往包含强强联手的共创,阿里云计算巢加速器与AMD 达成了深度合作。AMD大中华区销售副总裁周俊杰在活动现场发表了题为《突破性能边界 重芯定义下一代云计算》的分享,从“多、快、好、省”四个方面深度分析了AMD EPYC处理器如何为客户实现降本增效。
以下是周俊杰先生的演讲内容整理:
AMD大中华区销售副总裁 周俊杰
算力爆炸时代来临。
当前,有47%的企业觉得数字化转型方面的投资是重中之重,92%的企业认为他们过去在人工智能及大数据方面的投资正在实现回报。上图曲线显示全球的数据在持续增长,预计到2025年,全球数据总量会达到180+ZB。如果数据量持续按照这个体量增长,我们认为现有的平台和技术是很难支持的,因为现在的算力不够。愈演愈烈的数字化浪潮促使我们需要以更高效率、更大规模部署更多的计算性能。
要处理这么庞大的数据量,必须借助颠覆式的技术来完成。作为全球芯片领军企业,AMD每天都专注于推动高性能计算发展,致力于以卓越产品助推行业发展。我们以每隔一年半左右的时间表,推出新一代产品。去年11月发布的AMD全新第四代 EPYC处理器,可以从“多、快、好、省”4个方面来展现AMD如何帮助企业实现降本增效。
首先来看“多”。当前,半导体技术发展的密度很高,一个CPU中集成了超过900亿个晶体管,这是一个庞大的高密度的集成CPU。得益于单处理器中最高可拥有96核心,全新AMD EPYC处理器可帮助客户只需部署更少但性能更强大的服务器便可进一步满足他们的计算需求。这使他们能够在数据中心中实现更大的灵活性,以支持企业的可持续发展目标、推动现实世界红利。
“快”指的是性能方面。AMD最新第四代EPYC CPU仅以48核就带来领先的性能,超越客户现有60核的算力。我们认为,只有不断追求算力密度才能达到可持续发展。大量待处理的ZB数据,低数核的算力是不可能完成的,亟需大密度的集成算力进行运算。
全新第四代EPYC处理器,也带来不断增强的数据中心性能。AMD EPYC 9004 系列包括多项行业首创:唯一兼容 x86 的 5nm CPU,拥有多达 96 个 x86“Zen4”核心;提供 12 条 DDR5 内存 通道,并具有 128 条 PCIe® Gen5 通道,可以极大限度地提高 I/O 容量。同时在CPU性能方面创造了超过300多项的世界纪录。借助 AMD EPYC 9004 系列的 5nm 制程工艺,只需部署更少的服务器即可完成同样的工作,同时有助于降低功耗和二氧 化碳排放。搭载 96 核 AMD EPYC 9654 的双路服务器在运行 SPECpower_ssj®2008 时具有领先的 SSJ_OPS/W 整体得分。
一个性能高的半导体产品,一定有一个非常好的体系架构设计来支撑。在最新一代处理器中,我们把很多指令集和分支预测都做了加强,能够让它变成一个既符合通用计算、也符合特殊领域的半导体产品。
大家看到上图中提到的IPC提升约14%,是指每个周期运行指令性能提升,这不仅要求CPU本身结构设计提升,制程工艺也要提升。我们利用的是台积电最先进的制程工艺不断提升工艺水平,让算力提升更多、密度更高、散热更好,最终来完成时钟周期的指令集性能提升。
与此同时,在数据安全方面,AMD CPU 支持内存数据加密(SEV),通过“Security by Design”体系,AMD可在x86 CPU中进一步提供更强的安全功能。第四代AMD EPYC处理器系列增强了AMD Infinity Guard,作为一套先进的功能集,AMD Infinity Guard可提供对物理层和虚拟层的保护。与前代产品相比,第四代AMD EPYC处理器的加密密钥数量是其2倍,无论数据存储在本地、云端还是驻留在存储器中,它都可以帮助客户保护数据安全。
这也是阿里云最新推出的第八代AMD实例g8a与g8ae的标配,可以有效保障企业客户云上业务数据的安全。
基于AMD最新Genoa处理器的阿里云第八代实例g8a,搭载了阿里云全新计算体系架构CIPU,性价比相比上一代提升15%,满足通用企业用户提效降本的需求;此外,g8ae性能增强型实例,性能相比上一代最高提升高达55%,可以有效应对AI训练、HPC、EDA等应用对更高算力的需求。
在“省”的维度,我们发现如果想要实现高效可持续发展,则需要利用高密度的算力逐步替代在过去五年之内甚至超过五年的老旧设备,才可增加持续算力,降低企业运维成本。通过调研,我们发现新旧服务器可以做到1:5的有效替换。随着这样滚动淘汰的趋势,就可以把所有的算力集中起来,把数据中心的空间更好的节省出来,同时可以帮助客户减少接近7000平方公里森林而产生的二氧化碳,实现可持续发展。
以100万台客户现有的服务器举例,如果采用AMD 最新的半导体产品,大概只需不到56万台就可以提供同样的算力,我们能够帮助客户极大地降低数据中心的密度。
当前,半导体的发展是日新月异的,基本上每12-18个月就有新一代产品推出,而今天AMD打造的是一个算力天花板。希望大家能够在阿里云上,利用好这样的算力天花板。
周总表示:“从半导体厂商的角度,如果说阿里云是支持软件云生态的基座,那么AMD提供的是基座上的基座,通过先进的制程工艺,突破的性能和强劲的算力,助力企业实现数字化转型。同时把半导体的价值借助阿里云的生态传递给大家,共同去助推行业的创新。”
AMD的口号“同超越,共成就”,我们希望不仅仅是携手阿里云,同时也能和软件生态的合作伙伴一起,共同超越,共同成就!