云上普惠高性能计算平台,助力HPC行业创新
EHPC(弹性高性能计算)产品架构分为三个层次:资源层、服务层和使用界面层。资源层按HPC行业需求编排ECS实例、存储和调度管理资源,形成支持VPC和RDMA网络的集群。服务层提供集群资源管理、应用管理和作业调度等功能,并支持基于负载的弹性伸缩。使用界面层包括控制台、HPC PORTAL和Open API,方便不同用户操作。今年新发布的功能包括基于英特尔八代处理器的HPC实例、RDMA网络支持IB Verbs接口、拓扑感知的弹性伸缩能力以及Instant计算环境,优化了性能和成本。EHPC通过这些设计帮助客户快速上云并高效利用资源。
系列解读 SMC-R:融合 TCP 与 RDMA 的 SMC-R 通信(二)
通过上一篇文章 《系列解读 SMC-R:透明无感提升云上 TCP 应用网络性能(一)》我们了解到,RDMA 相对于 TCP 具有旁路软件协议栈、卸载网络工作到硬件的特点,能有效增加网络带宽、降低网络时延与 CPU 负载。而内核网络协议 SMC-R 在利用 RDMA 技术的同时、又进一步完美兼容了 socket 接口,能够透明无感的为 TCP 应用带来网络性能提升。因此,龙蜥社区高性能网络 SIG 认为 SMC-R 将成为下一代数据中心内核协议的重要组成,对其进行了大量优化,并积极将这些优化回馈到上游 Linux 社区。
阿里云的管理部门神龙
阿里云的管理部门神龙自制脑图,
这是我学习阿里云的管理部门神龙整理的资料。
在云上,因为要给很多的企业提供服务,所以需要把技术人员(CPU)分成不同的小组,租给不同的客户,这些小组就像工厂里的小工厂,我们把这个过程叫“虚拟化”。这样一来原来只负责计算的技术人员,就不得不当起了管理人员。
有了虚拟化技术无数台计算机可以“组合”成一台超级计算机
而一台计算机也可被“切割”成无数小计算机。随意“组合”和“切割”的代价就是“虚拟化损耗“。
RDMA在专用领域是网络延迟和高性能代名词,目前市场上几乎没有企业能够大规模使用 RDMA,这一技术天生有缺陷。但是本代神龙架构攻克了该问题。