阿里云的管理部门神龙

简介: 阿里云的管理部门神龙自制脑图,这是我学习阿里云的管理部门神龙整理的资料。在云上,因为要给很多的企业提供服务,所以需要把技术人员(CPU)分成不同的小组,租给不同的客户,这些小组就像工厂里的小工厂,我们把这个过程叫“虚拟化”。这样一来原来只负责计算的技术人员,就不得不当起了管理人员。有了虚拟化技术无数台计算机可以“组合”成一台超级计算机而一台计算机也可被“切割”成无数小计算机。随意“组合”和“切割”的代价就是“虚拟化损耗“。RDMA在专用领域是网络延迟和高性能代名词,目前市场上几乎没有企业能够大规模使用 RDMA,这一技术天生有缺陷。但是本代神龙架构攻克了该问题。

阿里云的管理部门神龙自制脑图,
这是我学习阿里云的管理部门神龙整理的资料。
在云上,因为要给很多的企业提供服务,所以需要把技术人员(CPU)分成不同的小组,租给不同的客户,这些小组就像工厂里的小工厂,我们把这个过程叫“虚拟化”。这样一来原来只负责计算的技术人员,就不得不当起了管理人员。
有了虚拟化技术无数台计算机可以“组合”成一台超级计算机
而一台计算机也可被“切割”成无数小计算机。随意“组合”和“切割”的代价就是“虚拟化损耗“。
阿里云为了解决云计算的“硬伤”——“虚拟化损耗“
专门成立了一个“神龙”部门,请来管理专家自研专用板卡
专人专岗负责虚拟化调度,他们更擅长管理和资源协调,而且管理专家的工资却比技术人员还低,让工厂获得了更大的收益。
RDMA在专用领域是网络延迟和高性能代名词,目前市场上几乎没有企业能够大规模使用 RDMA,这一技术天生有缺陷。但是本代神龙架构攻克了该问题。
阿里云将 ECI 和 ECS 并持,实现了云原生的超高弹性能力。
第四代神龙大幅提升了基础带宽、块存储、IOPS 等核心性能。
神龙 4.0 架构在延时方面表现卓越,其将时延从 90us 提升到了 30us,接近云架构的极限,也接近光速理论极限。
Screenshot_20221214_143006_com.alibaba.android.rimet_edit_58965084606626.jpg
Screenshot_20221214_143022_com.alibaba.android.rimet_edit_58978992085270.jpg
Screenshot_20221214_143035_com.alibaba.android.rimet_edit_58993188616518.jpg
Screenshot_20221214_150701_com.alibaba.android.rimet_edit_61335199472931.jpg
Screenshot_20221214_150711_com.alibaba.android.rimet_edit_61350723409908.jpg
Screenshot_20221214_150719_com.alibaba.android.rimet_edit_61358479543240.jpg

相关文章
|
4月前
|
弹性计算 人工智能 Oracle
阿里云弹性裸金属服务器是什么?有必要买吗?配置性能、规格功能及问题解答FAQ
阿里云弹性裸金属服务器(ECS Bare Metal)是融合物理机性能与云服务弹性的创新计算产品,基于神龙架构,提供CPU/内存/网卡100%独占、零虚拟化开销,同时支持分钟级交付、VPC组网、云盘快照等云原生能力,适用于Oracle/SAP、AI训练、金融核心、等保合规等高要求场景。
631 5
|
9月前
|
负载均衡 并行计算 异构计算
大模型训练推理优化(5): FlexLink —— NVLink 带宽无损提升27%
本期我们将介绍蚂蚁集团ASystem团队在大模型通信优化上的新工作FlexLink,旨在通过动态聚合多路通信(NVLink,PCIe,RDMA),在H800等典型硬件上将典型通信算子如(AllReduce, All Gather)吞吐提升最高达27%,尤其适合大模型长序列推理(Prefill阶段),及训练等通信密集的带宽bound场景。方案对精度无影响。
|
运维 Kubernetes Java
阿里云容器计算服务ACS ,更普惠易用、更柔性、更弹性的容器算力
ACS是阿里云容器服务团队推出的一款面向Serverless场景的子产品,基于K8s界面提供符合容器规范的CPU及GPU算力资源。ACS采用Serverless形态,用户无需关注底层节点及集群运维,按需申请使用,秒级按量付费。该服务旨在打造更普惠易用、更柔性、更弹性的新一代容器算力,简化企业上云门槛,加速业务创新。ACS支持多种业务场景,提供通用型、性能型及BestEffort算力质量,帮助客户更从容应对流量变化,降低综合成本。
|
存储 Linux 调度
OpenStack如何支持虚拟化技术?
【8月更文挑战第21天】
1038 0
|
负载均衡 网络协议 网络架构
|
负载均衡 网络架构
|
运维 前端开发 算法
揭秘成熟互联网团队:团队成员包括哪些岗位?
揭秘成熟互联网团队:团队成员包括哪些岗位?
932 0
|
存储 监控 调度
OpenStack
OpenStack
511 0
|
存储 人工智能 运维
智慧算力的基础设施峰会:关注行业趋势、磐久2.0 正式亮相
智慧算力的基础设施峰会:关注行业趋势、磐久2.0 正式亮相
智慧算力的基础设施峰会:关注行业趋势、磐久2.0 正式亮相
|
存储 监控 Cloud Native
阿里性能监控引擎建设之路
阿里巴巴智能引擎事业部自研的 Khronos 系统是阿里内部接入规模最大的性能数据存储引擎。Khronos 支持动态生命周期的存储计算分离架构,采用 schemaless 的 data model 设计,在万亿数据规模下为业务提供易用、高效、经济的服务,团队近期的优化工作也被国际学术会议CIKM2023收录。本⽂总结了Khronos 在性能监控领域遇到的技术挑战,以及在这个场景下的一些价值判断。

热门文章

最新文章