带你读《弹性计算—无处不在的算力》第二章:弹性计算产品家族 2.1:弹性计算的使用场景(一)

简介: 《弹性计算—无处不在的算力》第二章:弹性计算产品家族 2.1:弹性计算的使用场景(一)

     随着多媒体、机器学习、科学计算领域的快速发展,云上对于异构计算的需求被快速地激发出来,实例不仅需要实现过去普通的x86 虚拟化,还要能够支持异构计算部件的虚拟化或直通透传,使得在虚拟机内的应用可以将GPU FPGA 这一类部件利用起来,像普通x86 云服务器一样配置灵活、可调整。

在实例内,存储和网络是必不可少的两个功能。在云服务器诞生之初,实例读写所需要的存储多为本地存储(即虚拟机所在物理机本地的磁盘),本地存储的优点是服务器内部访问、效率高、成本低,但缺点也极其明显:容量空间有限、本地失效概率高、服务器宕机数据有丢失风险、无法立刻恢复业务、需要等待维修。这些都为后续发展云盘提供了明确的方向:存储和计算分离能够带来更高的可扩展性,数据丢失风险以N 个数量级的幅度降低。实例的存储绝大多数已经使用云盘来实现,也就是下面要介绍的“弹性块存储”。本地存储仅在少数场景下才会使用,如极高存储性能、极低单GB 存储成本、对数据可靠性没有强诉求等场景。

对于实例来说,网络性能中的数据收发功能和在此之上的访问隔离与互通灵活控制功能是基础,而这些都是依靠虚拟网络来实现的。每一个实例都有其对应的网络功能和存储功能的描述。

2.1 云服务器开天地

虚拟化技术是支撑整个云计算行业发展最重要的基础技术。

在虚拟化技术出现前,用户对于应用的运维主要是面向物理机的。资金并不充裕的用户会选择把多个业务所需的应用部署在一台服务器上运行。比如,把企业所需的DHCP 服务器、DNS 域名解析服务器、Web 应用服务器都部署在一台服务器上;把SAP 应用和企业办公的OA 系统部署在另一台服务器上,这样可以节省服务器,减少服务器的电力、机位、网络设备成本。但弊端也相当明显,不仅应用使用的端口可能冲突,而且共享的文件读写也会不可避免地产生冲突。另外,如果应用所依赖的系统库是共享的,那么系统库版本问题又会让管理维护人员“发疯”。运维工程师无时无刻不处于神经紧绷状态,一旦哪个应用崩溃,很可能会引发连锁反应,导致整个系统的宕机。当管理维护人员需要重新启动计算机时,这台服务器上所有运行的业务系统都会一起被连带着中断。

资金充裕的用户虽然可以为每一个业务系统都配置一台甚至多台服务器,但会造第2 章 弹性计算产品家族27


成服务器资源极大的浪费,每一台服务器负载都很低,绝大多数时间都在机架上“吃灰”。另外,每一台服务器所产生的电力、网络、机柜费用,也是极大的浪费;同时, 基础系统的维护,包括几十台、甚至上百台的服务器系统的升级系统、打补丁、升级应用等,所需耗费的工作量会大幅增加。

虚拟化技术的成熟很好地解决了上述问题,Intel AMD 在各自出品的CPU 中加入虚拟化指令,Windows /Linux 也相继提供了内核虚拟机,使虚拟机(虚拟服务器)可以更大地发挥物理硬件的性能。通过Hypervisor,在一台物理服务器上可以同时运行多台虚拟机。每台虚拟机都可以独立安装不同的操作系统,并能够独立运行、重启或关机,相互之间不受影响。虚拟机配给的硬件资源是由管理者调配的,对硬件资源的占用只要在配额之内,即使某个系统负载过高而宕机,也不影响其他虚拟机的工作。使用虚拟机可以让创建、撤销相关资源都在软件管理层面上完成。以往在升级服务器硬件时是需要断电拆机的,而在虚拟机上,扩展资源配给可以直接通过管理软件界面设定来做到热生效,销毁服务器与之同理。迁移、备份也更加方便,虚拟机的运行系统和环境对应的是物理服务器上的一个镜像文件,以前迁移服务器到异地机房时需要先下架后再小心翼翼地长途托运,生怕摔碰;而虚拟机的迁移只需拖动一个文件即可。

由于虚拟化层的存在,无论是热迁移应用,还是用快照做在线备份、恢复数据, 都变得极其顺畅。如果用户操作有误,可以随时回滚。而在物理系统上遇到这种情况时可能就得重做系统了。以前一台祼机从安装系统到部署业务平均耗时为12 小时, 而今在虚拟机上可以提前准备好各种模板,需要时仅使用模板克隆一次就能快速完成。传统服务器和虚拟服务器的差别如图2-1 所示。

App App 操作系统服务器硬件操作系统服务器硬件App App App 独立操作系统独立操作系统独立操作系统虚拟硬件虚拟硬件虚拟硬件服务器虚拟化传统服务器传统服务器虚拟化服务器服务器硬件

image.png

2-1  传统服务器和虚拟服务器的差别28


现在,在企业内部或互联网上,主流公共云服务商提供的云服务(例如云服务器、数据库服务、VPC、负载均衡等)绝大多数都是基于虚拟机的。可以说,正是有了这种“软件定义服务器”的能力,云上的资源按需使用、按量付费、分钟交付才成为可能,用户对于集群中所有虚拟机的运行情况都能及时掌握和按需调配。因此,当下整个云计算行业盛行及高速发展,虚拟化技术功不可没。

云服务器是所有云服务的基础,也是使用最普遍、用户接受度最高的弹性计算产品。因为虚拟化继承了x86 的标准硬件体系结构和操作系统标准应用界面的双重标准,所以,用户完全可以从过去使用物理机平滑过渡到使用云服务器,从而对底层物理资源的运维这一“脏活、累活”则被云服务提供商的自动化、大规模集中运维给取代了。

现在,云服务器的计算、存储、网络、系统环境部件已变得非常复杂,每一个侧面都需要大量的研发人员在背后持续优化,使云服务器的性能没有“短板”,成为一个发展均衡的“木桶”。

2.1.1 ECS 实例

在云产品,尤其是IaaS 类产品中,实例是一个常见的概念,特指虚拟计算环境。一台云服务器(为行文方便,以下简称为ECS)实例等同于一台虚拟机,包含CPU、内存、操作系统、网络、磁盘等基础计算组件。

根据业务场景和使用场景,ECS 实例可分为多个规格族。以阿里云产品为例, 对于通用的x86 计算密集型应用场景,C 系列规格族是最合适的产品;对于大数据场景,D 系列规格族的性价比最高;而对于异构计算场景,性价比最高的则是GN 系列规格族。在同一业务场景下,也可以选择多个不同的规格族。在同一个规格族里,根据CPU 和内存的配置,可以分为多种不同的规格。ECS 实例规格定义了实例的CPU 和内存的配置(包括CPU 型号、主频等,部分规格还包括特殊的异构计算部件或者本地存储)。图2-2 ECS 实例规格族图谱。

一个规格族包括若干实例规格(简称规格),对应产品的大中小不同配置。以计算型C6 规格族为例,规格ecs.c6.large 代表C6 规格族内的最小实例规格2 vCPU 4GB 内存的虚拟机配置,而规格ecs.c6.2xlarge 代表C6 规格族内的实例规格8 vCPU 16GB 内存的虚拟机配置。每一个实例规格除了直观地描述采用什么配置的虚拟机,还定义了其对应的存储云盘性能、内网性能等参数。这些是保障在实例使用过程中各方面性能稳定、可预期的关键,也就是云服务器产品的QoS 能力,这一点对于企业用户尤其重要。第2 章 弹性计算产品家族29

image.png

2-2  ECS 实例规格族图谱30


随着多媒体、机器学习、科学计算领域的快速发展,云上对于异构计算的需求被快速地激发出来,实例不仅需要实现过去普通的x86 虚拟化,还要能够支持异构计算部件的虚拟化或直通透传,使得在虚拟机内的应用可以将GPU FPGA 这一类部件利用起来,像普通x86 云服务器一样配置灵活、可调整。

在实例内,存储和网络是必不可少的两个功能。在云服务器诞生之初,实例读写所需要的存储多为本地存储(即虚拟机所在物理机本地的磁盘),本地存储的优点是服务器内部访问、效率高、成本低,但缺点也极其明显:容量空间有限、本地失效概率高、服务器宕机数据有丢失风险、无法立刻恢复业务、需要等待维修。这些都为后续发展云盘提供了明确的方向:存储和计算分离能够带来更高的可扩展性,数据丢失风险以N 个数量级的幅度降低。实例的存储绝大多数已经使用云盘来实现,也就是下面要介绍的“弹性块存储”。本地存储仅在少数场景下才会使用,如极高存储性能、极低单GB 存储成本、对数据可靠性没有强诉求等场景。

对于实例来说,网络性能中的数据收发功能和在此之上的访问隔离与互通灵活控制功能是基础,而这些都是依靠虚拟网络来实现的。每一个实例都有其对应的网络功能和存储功能的描述。

2.1.2 弹性块存储

虚拟化实例对于计算资源的充分利用和简化运维有非常大的帮助作用,但仅仅依靠计算虚拟化,并没有很好地解决数据块存储方面的问题。因为云服务器所持有的持久化数据,如操作系统、应用、用户数据等,既不丢失、不能出错,同时要保证数据的访问性能足够高,以满足多种场景的诉求。另外,还要具备云计算架构的优势,比如可以对存储容量或磁盘物理容量动态扩容、保证计算实例和数据的解耦合,降低计算或存储单方面运维的复杂度等。云上的弹性块存储(Elastic Block Storage)的应用场景和产品特点都是基于以上业务需求发展起来的。经过长久的发展,云上的弹性块存储系统和传统的计算机存储系统一样,已成为云服务器系统中既重要又有挑战的子系统之一。

弹性块存储是弹性计算家族中数据块级别的块存储产品,简称云盘,具有低时延、高性能、持久性、高可靠等特点。云盘采用分布式三副本机制,为ECS 实例提供99.9999999%9 9)的数据可靠性保证,支持在可用区内自动复制数据,防止意外硬件故障导致的数据不可用,保护业务,免于受组件故障的威胁。就像硬盘一样,用户可以对挂载到ECS 实例上的云盘做分区、格式化、创建文件系统等操作, 并对数据进行持久化存储。第2 章 弹性计算产品家族31


弹性块存储按照用户需要的存储使用场景和特点,可以划分为以下几个阶段:

最早一代的云盘(普通云盘)是具备高可靠性、一般随机读写性能的云盘产品。这一代产品从根本上解决了本地存储的可靠性和可用性问题,但性能与本地盘相比,仍具有较大的差距。

随着技术的演进,以及更新、更合理的硬件架构的出现,普通云盘逐渐演进成了具有更优I/O 性能的SSD 云盘和高效云盘。这一代产品最高可以达到数万IOPS Gbps 级别的数据吞吐能力。其性能已经比较接近本地盘了。

最新一代ESSD 云盘产品达到了百万量级IOPS 和数十Gbps 的数据吞吐能力, 在性能方面基本等同于本地存储。


无论普通的块存储还是云盘存储,都是单节点挂载、单节点读写访问的产品,随着更多的传统企业上云,传统IDC 中多服务器共享访问同一块存储的场景需求也在云上产生。在典型的集群架构中,多个计算节点通常需要访问同一份业务数据。为防止一个或多个计算节点发生故障而导致业务中断,共享块存储可以保证集群对外提供业务访问的持续性和高可用性。用户可将重要的业务数据存储在共享块存储上,并通过集群文件系统对共享块存储进行统一管理。当多个前端计算节点并发地读写数据时,共享块存储能保证数据在多个计算节点间的一致性。

回望过去,云盘在保持着高可靠性和免运维的前提下不断优化性能,走的是一条使产品在性能上越来越符合本地盘业务需求的道路。当然,本地盘存储并没有被完全抛弃,随着互联网和移动互联网的广泛应用,企业数据以前所未有的速度积累,而基于大数据的应用,不论离线分析还是在线计算,都被越来越多的企业所采纳。大数据的典型场景对物理介质的可靠性并无更高要求,因为在应用层已经通过分布式存储将数据打散存储在多计算节点上,所以高性能和低成本(应对海量数据)是这个场景的核心诉求,而本地弹性块存储正是针对这个场景的产品而设计的,它基于云服务器ECS 所在物理机(宿主机)上的本地硬盘设备,为ECS 实例提供本地存储访问性能, 是为那些对存储I/O 性能和海量存储性价比有极高要求的业务场景而设计的产品。


相关实践学习
块存储快速入门
块存储是阿里云为云服务器ECS提供的块设备产品。通过体验挂载数据盘、分区格式化数据盘(Linux)、创建云盘快照、重新初始化数据盘、使用快照回滚云盘和卸载数据盘等功能,带您快速入门块存储。
相关文章
|
3月前
|
弹性计算 Kubernetes 负载均衡
ECS:云原生计算的新篇章
ECS:云原生计算的新篇章
|
3月前
|
弹性计算 运维 监控
【阿里云弹性计算】从物理机到阿里云ECS:企业IT架构转型升级之路
【5月更文挑战第29天】随着云计算兴起,企业正转向阿里云ECS以应对传统物理机的挑战。本文详述了这一转型过程,包括现状评估、迁移计划制定、测试环境搭建、应用数据迁移及后期监控优化。转型升级可提升资源利用率,降低运维成本,加快业务响应,并增强数据安全。示例代码展示了使用阿里云Python SDK创建ECS实例的过程。
175 1
|
3月前
|
存储 弹性计算 监控
【阿里云弹性计算】阿里云ECS全面解析:弹性计算服务的核心优势与应用场景
【5月更文挑战第20天】阿里云ECS是提供可伸缩计算能力的云服务,支持多种规格实例,满足不同需求。其核心优势包括灵活性、高性能、高可用性、安全性和易用性。适用场景包括网站托管、大数据处理、游戏多媒体应用及测试开发环境。通过Python示例代码展示了如何创建ECS实例,助力企业专注业务发展,简化基础设施管理。
139 5
|
3月前
|
弹性计算 监控 数据库
【阿里云弹性计算】企业级应用上云实战:基于阿里云 ECS 的 ERP 系统迁移案例
【5月更文挑战第25天】制造企业将面临资源不足、维护成本高和数据安全问题的ERP系统迁移到阿里云ECS,实现业务上云。通过数据迁移、应用部署、网络配置和性能优化等步骤,企业享受到弹性计算资源、高可靠性和数据安全优势,降低维护成本。阿里云提供24小时支持,助力企业数字化转型。此案例展示企业级应用上云的可行性,鼓励更多企业借助云计算实现创新发展。
118 0
|
3月前
|
弹性计算 编解码 供应链
倚天经典客户案例|开发者分享会
2022年2月,基于倚天弹性计算的产品实例正式对外进行邀测。经过大半年的时间,在2022年云栖大会上,ECS倚天实例正式商业化。在宣布倚天商业化的同时,已经经历了阿里巴巴电商、双十一等流量洪峰的考验,包括邀测的内外部头部客户业务。
|
11月前
|
存储 弹性计算 人工智能
弹性计算是一种非常有用的技术
弹性计算是一种灵活的计算资源分配方式,它可以根据应用程序的需求动态地调整计算资源的数量和类型。这种技术可以帮助企业在高峰期处理更多的请求,同时在低峰期释放不必要的资源,从而最大限度地提高资源利用率和降低成本。
73 1
弹性计算是一种非常有用的技术
|
10月前
|
运维 负载均衡 Cloud Native
带你读《浅谈阿里云通用产品线Serverless的小小演化史》------导论
浅谈阿里云通用产品线Serverless的小小演化史(1)
|
9月前
|
弹性计算 开发者
阿里云弹性计算经济型e实例火爆发布!
阿里云弹性计算经济型e实例火爆发布!
239 0
|
12月前
|
弹性计算 人工智能 算法
阿里云张伟:软件跨架构迁移(X86 -> ARM)的原理及实践|阿里云弹性计算技术公开课直播预告
针对阿里云倚天实例的软件迁移,阿里云为开发者提供了迁移工具EasyYitian和性能调优工具KeenTune,能够帮助用户解决软件迁移评估分析过程中人工分析投入大、准确率低、代码兼容性人工排查困难、迁移经验欠缺、反复依赖编译调错定位等痛点,实现业务在ARM ECS的快速适配。EasyYitian支持主流开发语言,通过系统自动化扫描可以一键生成分析报告。KeenTune通过AI算法与专家知识库的有效结合,为软件应用提供动态和静态协同调优的能力。
阿里云张伟:软件跨架构迁移(X86 -> ARM)的原理及实践|阿里云弹性计算技术公开课直播预告
|
11月前
|
弹性计算 开发者
阿里云弹性计算经济型e实例火爆发布
性价比首选,特惠云服务器,个人开发者、学生、小微企业大众的福音燃情上线啦!价格低至0.5元/天!!! 全用户群低价首选,续费不涨价!
947 0