阿里云虚拟化架构|学习笔记

简介: 快速学习阿里云虚拟化架构

开发者学堂课程【高校精品课-河海大学-云计算技术与应用:阿里云虚拟化架构】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/9/detail/24


阿里云虚拟化架构


内容介绍

一、云数据中心传统虚拟化架构

二、阿里云神龙架构

三、基于神龙架构的弹性裸金属服务器

四、阿里云弹性计算第六代服务器

 

一、云数据中心传统虚拟化架构

神龙是阿里云自主研发的软硬一体化云虚拟化技术,是面向云原生设计的新一代云基础设施架构,同时支持阿里云的裸金属服务器、ecs 云服务器、容器服务等多种计算形态,可以为用户提供更多更完整的云端解决方案。虚拟化技术是云计算的传统技术之一,它的核心思想是利用软件或者固件管理层构建虚拟化层,把物理资源映射为虚拟资源,在虚拟资源上可以安装和部署多个虚拟机,从而实现多用户共享物理资源。

image.png

image.png

这张图是云数据中心传统的虚拟化架构图,从图中可以看到,底层是大型的物理机集群,要实现资源动态分配和调度,需要将物理机集群资源通过虚拟化技术进行抽象整合,形成统一的虚拟资源池,这时每一台物理机上都会运行宿主机和虚拟化的系统软件,在云计算应用当中,用户所使用的虚拟机计算能力平稳性,弹性都是由虚拟化软件来完成的,包括虚拟 cpu,虚拟内存,虚拟中端,虚拟网络等都是由 Hypervisor 来完成的。

这种传统的虚拟化架构存在的天然的缺陷,主要表现在以下几个方面,

第一,宿主机是用户所需要的系统,而虚拟机是用户所使用的系统,两者共处一室,导致资源争抢,隔离性弱,造成虚拟机计算能力的波动;

第二,宿主机和虚拟机 Hypervisor 都要占用 cpu 和内存资源,这就意味着单排物理机在原来的算力上大打折扣,因此,在物理服务器上采用虚拟化技术生成的云服务器它的计算性能必然比云服务器要差,资源的浪费就导致了成本的提升;

第三,存储网络的虚拟化都是由软件实现的,虽然具有一定的灵活性和扩展性,但是性能稳定性较差,性能瓶颈明显;

第四,Hypervisor 是运行在物理机内部的,难以支持裸机服务和存储网络的弹性,无法以云的方式满足用户对物理机的需求。

为了解决传统虚拟化架构的性能瓶颈,满足用户对计算性能,网络接入,存储读写能力的需求,阿里云提出了新的解决方案,就是通过专业芯片来解决虚拟化开销,为每个节点提供功能性和管理性的支持,使云服务器即具有物理机的性能,同时又能提供虚拟机的体验,神龙架构就应运而生了。

 

二、阿里云神龙架构

image.png

神龙架构是软硬一体化的云虚拟化技术。阿里云研究了神龙芯片,自研虚拟化 MoC 卡,神龙多节点服务器以及配套的文件体系,神龙卡是神龙架构的核心组件,拥有独立的处理,输入,输出等单元,承担了原来软件实现的网络存储,以及外围设备的虚拟化,卡中所有的接口都和虚拟机保持一致,支持外部云台存储,vpc 网络等资源,跟需密集使用的体验是一样的,神龙架构使用专属芯片硬件来实现输入输出引擎,解决现代服务器的输入输出性能瓶颈。

 image.png

2017年阿里云正式发布了第一代神龙架构,第一代的特点是实现裸金属蓄力化,通过神龙卡解决了物理机使用云存储,vpc 网络挂在本地盘的问题,使云服务器兼具虚拟机的体验和物理机的性能。

2018年,阿里云发布了第二代神龙架构,和第一代相比,神龙芯片的能力进一步增强,不但支持裸金属系统,还可以支持虚拟机,阿里云为虚拟机设计了一个超薄的 Hypervisor,基本上没有性能开销,在提供计算服务的物理机上,只运行经过踩点的系统和轻料化的 Hypervisor,用户可以获得所有的cpu和内存资源,并且每个虚拟机之间通过硬件设备隔离,虚拟机之间的使用没有干扰,第二代神龙架的特点是做到了技术的融合资源的并驰,即一套软硬件支持容器,虚拟机和裸金属三类服务。

image.png

2019年9月,阿里云正式发布了第三代神龙架构,整个性能处于业界最高水平,在存储,网络关键性能指标方面,比业界类似架构提升五倍性能,第三代神龙做到了存储,网络,数据全面芯片化,性能大幅提升,提供了硬件级qos管理,增强型融合网络,可以提供接近裸机的低延迟网络,增强型的硬件队列支持1000个1024存储队列和1000个1024网络队列,队列和队列之间的隔离性进一步增强。第三代神龙架构开启了超性能时代,提供极限计算能力,满足极致性能和安全的企业要求,它是云原生最佳载体,安全性能提升30%,支持多计算形态,为互联网,金融,零售等近300种场景提供超强超稳的计算稳定。

 

三、基于神龙架构的弹性裸金属服务器

弹性裸金属服务器是一种可弹性伸缩的高性能计算服务。计算性能与传统物理机无差别,兼具虚拟机的弹性和物理机的高性能,具有安全物理隔离的特点,其性能优势表现在以下几个方面。

 image.png

首先,基于神龙架构的裸金属服务器没有软件虚拟化带来的性能开销,可以完全发挥处理器和内存的性能,提供极限计算能力。

其次,神龙裸金属服务器具备物理机级别的完整处理器特性以及物理机级别的资源隔离优势,提供安全、可靠、稳定、独占的计算资源。第三,神龙裸金属服务器支持嵌套虚拟化,主流的虚拟化系统都可以在上面运行。

它能与阿里云的其他产品,例如存储、网络、数据库等部分对接,并完全兼容 ecs 云服务器实例的镜像系统,可以通过挂载镜像进行初始化,还可以通过 open API 操作提高运维效率。

因此,基于神龙架构的裸金属服务器在克服传统云服务器缺点的同时,又保留了弹性部署、API 操作、镜像启动、VPC 网络等云服务器特性,兼具物理机的高性能和虚拟机的灵活性。

弹性裸金属服务器开创了一种新型的云服务器形式,相比同配置的物理机,其性能大幅提升,支撑了各种流量高峰,如12306的春运抢票、微博热点的暴涨流量,钉钉两小时扩容10万台云服务器等。在双11大促中,弹性裸金属服务器提供了数百万 vcpu 计算能力,顺利承载双11流量高峰。

随着云计算的发展,用户对极致性能、安全和物理隔离慢慢变成一种普遍需求,届时,持续创新的神龙架构或许将会主导下一代的计算需求。

可以通过阿里云的官网获取基于神龙架构的云服务器相关资源。

 

四、阿里云弹性计算第六代服务器

阿里云弹性计算第六代云服务器是阿里云发布的最新一代 ecs 云服务器新一代产品,全面升级了计算、存储和网络性能。第六代云服务器基于阿里云自研的神龙架构和全新的轻量化 hypervisor,您可以获得所有的宿主机 cpu 和内存资源,提高了整机和大规则实例的各项能力,让每一位用户可以享受神龙计算平台的能力。在计算方面,相比上一代实力,第六代云服务器可提供的最大计算性能提升超过20%,

image.png

并且具有全球领先的计算稳定性,在阿里巴巴多个典型深度学习复赛上的性能都达到了上一代英特尔至强可扩展处理器的二至四倍。第六代云服务器支持 numa,可使内存访问延时最多降低50%,对内存延迟敏感的场景,如 OLAP场景的性能可提升20%以上。在存储方面,第六代云服务器全面支持 ESSD、存储 IOPS 和带宽在实力级别具备 qos控制能力,保证您的实力之间使用无干扰。

在网络方面,第六代云服务器的突发带宽最多可以达到上一代实例的三倍,在提高性能的同时大幅节省成本。除了性能上的全面提升,第六代云服务器的价格也有大幅下调,降幅最高可达47%,让你享受更多的技术红利。弹性计算第六代云服务器拥有极致弹性以及高度安全和稳定性,提供超高性价比。是您的云上首选服务器。

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
2月前
|
存储 数据挖掘 BI
2-5 倍性能提升,30% 成本降低,阿里云 SelectDB 存算分离架构助力波司登集团实现降本增效
波司登集团升级大数据架构,采用阿里云数据库 SelectDB 版,实现资源隔离与弹性扩缩容,查询性能提升 2-5 倍,总体成本降低 30% 以上,效率提升 30%,助力销售旺季高效运营。
208 9
|
2月前
|
存储 弹性计算 运维
AI时代下阿里云基础设施的稳定性架构揭秘
计算、存储、网络作为云计算基础 IaaS 服务,一直是阿里云的核心产品,承载着百万客户的 IT 基础设施。曾经我们认为应用高可用、服务分布式可以满足客户对 IaaS 所有的稳定性诉求。
417 2
AI时代下阿里云基础设施的稳定性架构揭秘
|
29天前
|
人工智能 Cloud Native 安全
解读阿里云刚发布的《AI 原生应用架构白皮书》
阿里云在云栖大会重磅发布了《AI 原生应用架构白皮书》,该白皮书覆盖 AI 原生应用的 11 大关键要素,获得业界 15 位专家联名推荐,来自 40 多位一线工程师实践心得,全书合计超 20w 字,分为 11 章,全面、系统地解构 AI 原生应用架构,包含了 AI 原生应用的 11 大关键要素,模型、框架、提示词、RAG、记忆、工具、网关、运行时、可观测、评估和安全。本文整理自阿里云智能技术专家李艳林在云栖大会现场的解读。
921 30
|
27天前
|
人工智能 缓存 安全
阿里云发布《AI 原生应用架构白皮书》
阿里云联合阿里巴巴爱橙科技,共同发布《AI 原生应用架构白皮书》,围绕 AI 原生应用的 DevOps 全生命周期,从架构设计、技术选型、工程实践到运维优化,对概念和重难点进行系统的拆解,并尝试提供一些解题思路。白皮书覆盖 AI 原生应用的 11 大关键要素,获得 15 位业界专家联名推荐,来自 40 多位一线工程师实践心的,全书合计超 20w 字,分为 11 章。
1306 14
|
1月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
162 1
|
1月前
|
存储 人工智能 关系型数据库
阿里云AnalyticDB for PostgreSQL 入选VLDB 2025:统一架构破局HTAP,Beam+Laser引擎赋能Data+AI融合新范式
在数据驱动与人工智能深度融合的时代,企业对数据仓库的需求早已超越“查得快”这一基础能力。面对传统数仓挑战,阿里云瑶池数据库AnalyticDB for PostgreSQL(简称ADB-PG)创新性地构建了统一架构下的Shared-Nothing与Shared-Storage双模融合体系,并自主研发Beam混合存储引擎与Laser向量化执行引擎,全面解决HTAP场景下性能、弹性、成本与实时性的矛盾。 近日,相关研究成果发表于在英国伦敦召开的数据库领域顶级会议 VLDB 2025,标志着中国自研云数仓技术再次登上国际舞台。
235 0
|
2月前
|
存储 弹性计算 运维
AI 时代下阿里云基础设施的稳定性架构揭秘
十五年磨一剑,稳定性为何是今天的“命门”?
|
3月前
|
SQL 运维 数据挖掘
森马服饰从 Elasticsearch 到阿里云 SelectDB 的架构演进之路
森马引入阿里云 SelectDB 替换原 Elasticsearch + 业务库混合架构,统一分析 16+ 核心业务,打通 BI 组件,大幅简化数据同步链路和分析系统架构。实现复杂查询 QPS 提升 400%,响应时间缩短至秒级,亿级库存流水聚合查询缩短至 8 秒内的显著收益,有效驱动森马全渠道运营效率持续增长与业务创新。
116 0
森马服饰从 Elasticsearch 到阿里云 SelectDB 的架构演进之路
|
4月前
|
存储 缓存 分布式计算
高内存场景必读!阿里云r7/r9i/r8y/r8i实例架构、性能、价格多维度对比
阿里云针对高性能需求场景,一般会在活动中推出内存型r7、内存型r9i、内存型r8y和内存型r8i这几款内存型实例规格的云服务器。相比于活动内的经济型e和通用算力型u1等实例规格,这些内存型实例在性能上更为强劲,尤其适合对内存和计算能力有较高要求的应用场景。这些实例规格的云服务器在处理器与内存的配比上大多为1:8,但它们在处理器架构、存储性能、网络能力以及安全特性等方面各有千秋,因此适用场景也各不相同。本文将为大家详细介绍内存型r7、r9i、r8y、r8i实例的性能、适用场景的区别以及选择参考。