编者按:11月4日,阿里巴巴集团研究员、阿里云智能弹性计算与无影产品线总经理张献涛在2022云栖大会“探索增长动能——互联网产业与飞天技术创新峰会”上发表了题为《云原生计算基础设施,护航互联网企业创新》的演讲,并邀请了Epic Games大中华区企业级业务总监徐良安一同分享了阿里云与Epic Games的相关合作。本文根据该演讲整理而成。
阿里巴巴集团研究员、阿里云智能弹性计算与无影
产品线总经理 张献涛
01 新时代对计算基础架构提出更高要求
互联网正在往全新的智能化、高效能和新交互时代演进,对计算基础架构提出更高要求。
企业希望提供给用户更极致的体验,这需要依赖智能推荐、大数据挖掘等数据智能技术,进行更高效的数据处理,呼唤更低延时、更高性能的计算基础设施;同时,“小步快跑,快速试错”的迭代策略,要求敏捷高效的基础设施,支持业务低成本快速试错;面向未来,沉浸式体验、XR等开始兴起,互联网呈现2D逐步3D化的趋势,需要超大规模的算力及全平台视觉计算生态的支持。
阿里云弹性计算,从基础设施、自服务能力与生态等层面,全方位构建面向互联网企业的云基础架构,帮助企业迎接新时代。
02 弹性计算ECS再升级,保障流畅稳体验
首先,在底层基础设施部分,随着企业应用不断地提出对强算力、低时延、高带宽的要求,以 CPU 为中心的传统架构面临越来越多的挑战,阿里云从数据中心的内部体系结构里做了体系化创新,将过去以 CPU 为中心的体系架构,改变成以云操作系统+CIPU为中心的体系架构。
在飞天操作系统+CIPU的加持下,阿里云即将推出第八代弹性计算实例,它的数据处理效率将会有大幅提升,对客户提到的降本增效会有很大的帮助。
在算力维度,八代主售实例选用最新处理器,包括英特尔最新第四代至强可扩展处理器。其在通用算力提升的基础上,具备原生支持硬件加速能力,其中AI领域,训练场景性能提升2倍以上;加解密、压缩/解压缩等场景下性能提升4倍以上,为客户提供场景化的超高性价比。
同时,ECS实例持续打造超高安全水位,全量搭载TPM可信芯片,在确保云上运行环境的完整性,配合加密计算能力及内存加密TME技术,实现云上原生计算安全。
除了算力及安全能力提升,网络及存储I/O均实现大幅演进,适配NVMe云盘,支持共享,时延降低至百微秒;物理网络升级至2*100G超大带宽,全面标配自研eRDMA加速能力,显著提升网络传输效率。
提到eRDMA,大家下意识认为只针对高性能计算的应用,实则不然。eRDMA兼容标准的网络接口,无需更改任何业务逻辑,大部分应用只要适配了接口,都可得到性能的提升。
TCP物理网延迟最短也仍要十几微秒,而eRDMA延迟最低5.5微秒,并给Redis数据库场景、Spark大数据场景、AI训练场景、HPC场景等场景分别带来80%、30%、30%、38%的性能提升。
去年云栖大会发布的倚天710芯片,在集团内部和外部客户中试用效果非常好,也即将在本月15号全面商业化。
值得注意的是,ECS倚天实例的架构和传统的计算架构完全不一样,以前的双路服务器需要双CPU连接,现在CPU变成CIPU的外设。CIPU不仅可以连接倚天710,也可以连接其他芯片,并得到更好的性能表现。
使用了倚天710,在编解码的场景下和传统实例相比,实现了80%的性价比提升,数据库场景、AI推理场景、大数据场景也都分别有着30%、70%、50%的性价比有效提升。我们相信,通过技术的不断研发和进步,可以让产品更具性价比,为客户在降本增效。
03 FinOps x CloudOps,高效支撑敏捷开发
除了挑选高性能高性价比的实例之外,客户的业务如何更好的适配云,以及如何找到正确的用云“姿势”,是降本增效首要的两个发力方向。
比如,汇量科技作为全球性技术服务平台,构建了高度弹性的云原生业务架构,在使用节省计划+按量付费模式后,云上成本支出下降20%。
除了灵活组合付费模式,合理使用CloudOps云上自动化运维套件,也能帮助企业研发运维工程师在降本的同时提升效率。部分云上企业面临着弹性容量管理成本高、应用发布部署效率低、服务异常问题定位慢等状况,使用了CloudOps之后,成本降低30%,效率提升50%,MTTR缩短 35%。CloudOps套件能够给带来高效智能的用云体验,带来更多降本增效的可能。
04 视觉计算平台,支撑探索下一代互联网
创新是互联网企业的永恒主题。视觉计算被认为是下一代互联网的关键技术。在IaaS能力的基础上,我们需要和更多的ISV合作伙伴一同打造视觉计算生态。
作为生态的重要组成部分,阿里云和业界知名的3D引擎Unreal Engine母公司Epic Games展开全面合作。相信能有效降低3D应用的开发门槛,加速企业探索下一代互联网。
现场邀请到了Epic Games大中华区企业级业务总监徐良安,分享与阿里云合作的感受:
“经过30多年的努力,我们在图形渲染领域也积累了很多技术,包括第五代虚幻引擎中的“核武器”:实时光线追踪和无限多边形技术;并通过Epic Games Online Service的服务,让全世界开发者轻松跨平台、跨国家、跨行业连接用户。为了迎接web 3.0元宇宙的到来,我们也将拥有的3D资产平台免费开放给大家,受益整个行业。
开源是Epic Games首要强调的理念,同样重要的商业理念则是普惠。虚幻引擎在大多数情况下都是免费的,在小部分情况下是可以客户先赚钱,再共同进步。
我们深信web3.0时代是3D的、高清的、交互的,因此虚幻引擎不可或缺;同时web3.0也将是基于云的,所以很高兴能和阿里云一起合作,助力开发者、助力商业伙伴机构业务更高效,让用户收获更良好的体验。
”
Epic Games大中华区企业级业务总监 徐良安
05 “飞天加速计划”加码百亿补贴,加速企业创新
阿里云弹性计算在打造产品技术的同时,也关注云计算行业人才方面的培养。通过飞天加速计划的顺利进行,我们看到有超过2200所高校的数十万师生参与了飞天加速计划,在云上免费体验多达11.6亿的算力时。
今年,飞天加速计划升级至3.0阶段,将会加入对中小企业上云的补贴。补贴涵盖了47种云服务器的规格,最长补贴年限3年,最大让利幅度高达64%。
在今天,中小企业线下使用数据中心的成本仍然很高,希望通过飞天加速计划,能够和中小企业一起在云上共同成长,也希望通过阿里云弹性计算产品能力加持及云原生计算基础设施的助力,更好护航企业互联网企业实现创新。
点击这里,观看嘉宾在云栖大会的精彩演讲。