带你读《弹性计算—无处不在的算力》前言

简介: 带你读《弹性计算—无处不在的算力》前言

何为弹性计算

阿里云弹性计算立项已十年有余,其极为庞大的产品与技术体系已为各行业超百万的企业提供了 IT基础设施服务,满足了传统IT基础设施所不能满足的各行业快速变化的竞争需求,无论是在创新成本、创新时效,还是灵活性上。弹性计算通过虚拟化中间层隔离了软件与硬件,降低了用户应用软件对于某台具体物理设备的紧耦合性,从而整合池化了海量硬件资源。

弹性计算通过大规模自动化集约运维技术,更好地保障安全性和业务连续性;通过弹性伸缩降低成本,提升业务交付敏捷度;通过 API化让基础设施的管理、运维自动化,简化了IT系统维护的复杂度,大幅降低运维成本。为了帮助读者更容易理解整体脉络,这里尝试从云服务商核心价值的角度,抽象出弹性计算产品的三重身份。

身份一:制造商

弹性计算先将 IDC、物理网络、各种服务器、计算资源和存储资源经过网络虚拟化、切割、封装、生产等流程生成一台台的不同规格族、不同规格粒度的云服务器,再将这些云服务器通过互联网的方式交付给用户使用。由于在场景上需要覆盖通用计算、异构计算和高性能计算,映射不同规格的实例,所以,底层需要有各式各样的服务器作为支撑。其中,通用计算除了传统的强者 Intel,还有国产品牌及 ARM 等 ;异构计算更是百花齐放,如GPUFPGANPU,除了服务器本身的计算芯片和配置对计算场景的覆盖,它们还完成了核心技术从标准硬件+    系统软件向专有芯片和硬件方面的加速演进,比如类似弹性计算底层的神龙架构在存储和网络虚拟化的硬   件卸载方面,正在让性能和成本走向下一个时代。

同时,产品方面,除了主流的 VM形态,在裸金属、专有宿主机DDH、弹性容器实例(ECI)等不同领域的计算单元封装形态上,针对用户使用场景的创新也层出不穷。从制造商角度来讲,弹性计算的核心问题就是质量、性能和成本,即在规模上利用自研的软硬件技术、系统与平台技术,结合供应链的能力提升计算单元制成品的性能,并且在提升质量的同时降低各种成本。从用户可以定制化、柔性生产和秒级交付这个角度来看,弹性计算具备了工业互联网的所有特征。

身份二:运营商

弹性计算预先铺设了大规模的 RegionIDC、网络、服务和基础设施,通过飞天云操作系统构建了一个巨大的、相互连接的计算资源池,对其再加以调度和库存管理。在计量计费多租户支撑体系对这个资源池的管理和切割的前提下,弹性计算的按量付费,如资产购买的包年包月和预留实例券RI,以及闲置库存变现的 Spot 抢占式实例等灵活的计算力获取方式,让弹性计算得以灵活地交付计算资源。从运营商身份来讲,弹性计算更多地通过智能调度体系对这个预先铺设的池子进行容量管理,在保障每个租户 SLA的前提下,让资源利用率最大化。在满足用户对广泛的计算力的覆盖要求,以及用户业务峰谷对弹性的要求的同时,控制好成本。除了平台技术,核心要素就是规模,只有上了规模才能让弹性计算在成本和弹性体验中取得一个有效的平衡。

身份三:服务商

客户购买计算力后,我们需要通过极为强大的、数据驱动的运维平台,给其提供不宕机的计算服务。

监控、日志和异常事件体系可提升计算的透明度和客户的安全感;强大的管控系统,通过 API展现对计算力的创建、管理和运维的原子控制力,提升用户对计算单元的控制力 ;在这些原子 API 之上,构建自动化部署编排InfrastructureasCode、自动化运维编排(OperationasCode)和自动化弹性编排(ElasticAutomation)等一系列平台支撑服务。基于这些平台支撑服务,通过叠加容器服务和函数计算及其他运维产品构建了垂直栈上完整和高效的计算力交付能力。

管理和运维服务方式多数免费,让云上云下企业 ITDevOps效率发生革命性变化,最终让用户使用计算服务,和使用水电一样方便,这一系列的平台支撑服务功不可没。对服务商身份来讲,弹性计算服务的覆盖、质量、效率和体验就是核心要素。

何为本书

弹性计算作为核心的云计算服务之一,通过一种灵活、动态、集成的,以及能够为企业提供实时弹性计算力的 IT模式,已经为各行各业超过百万规模的企业提供了服务。在弹性计算已经进化成为极为庞大的产品与技术体系的当下,我们想对这些产品和技术的精髓,在本书中进行一个系统的梳理、沉淀和呈现,力争让本书成为大家在云计算时代披荆斩棘的利器。

本书以产品 + 技术的写作形式全面地阐述了计算、存储、网络,以及成本、运维和安全六大核心内容,也分别代表了阿里云弹性计算这个产品技术体系的六大核心领域,每一章均由各领域的领军人物撰写。与其说他们是领军人物,更确切地说,是奋战在云计算一线的、和阿里云一起成长起来的战士们,他们把自己日常冲锋和奋战的经验精华融入每一章当中,在背负业务压力、密集地进行线上架构和产品迭代的同时,也对这本书倾注了不少的心力、脑力和体力。

另外,本书还对弹性计算是否已经实现了基础设施的无感使用,未来还有哪些需要做深、做厚的地方等问题进行了展望,更提供了三个阿里云真实的客户案例,供大家在实践中参考,赋能企业决策者提升运用云计算的能力,加速拥抱数字化转型的信心。本书可以被看成阿里云弹性计算的研发成果合集,更可以被视为诸多客户上云实践的总结和抽象。

云计算的概念本身是完美的,作为置身其中构建这个产品体系的技术人,我这些年最大的感受就是:云计算的核心技术不仅需要从书本上和开源软件里学;更需要非常务实地去解决一个个客户工单,去复盘一个个故障,去踏踩一个个,不断去分析每个问题细节找到根本原因;再在工程、架构和代码上不断迭代。既需要紧扣客户痛点和需求,同时还需要有一份傻傻的坚持。

最后,我谨代表本书的作者们,向所有陪伴我们成长的用户和开发者们致敬,也向当前正在及历史上曾经工作在弹性计算领域的工程师们致敬。正是广大用户的不离不弃,以及一代代的弹性计算人的前仆后继、浴血奋战,才成就了本书,以及本书描述的产品和技术体系。

 

蒋林泉(雁杨)阿里云研究员

2020 7 月于杭州

 

 

 

 

相关文章
|
7月前
|
人工智能 自然语言处理 测试技术
通义灵码上新推理模型,快来体验数学编程双冠王 Qwen2.5-Max
近日,通义灵码上新模型选择功能,除新增 DeepSeek 满血版 V3 和 R1 外,Qwen2.5-Max 也正式上线,它使用了超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。
|
9月前
|
人工智能 算法 芯片
天天都在说的“算力”到底是个啥?一文全讲透!
算力是数字经济发展的重要支撑,尤其在AI和大数据应用中起着关键作用。阿里云致力于构建全球领先的算力基础设施,助力各行业数字化转型。吴泳铭和马云均强调了算力在未来科技竞争中的核心地位。2023年底,我国算力总规模达230EFLOPS,位居全球第二。算力分为通用、智能和超算算力,广泛应用于人工智能训练与推理等场景。中国正加速建设智算中心,推动算力产业链发展,并注重绿色低碳和智能运维,以应对日益增长的计算需求。
12714 19
|
11月前
|
Linux UED iOS开发
|
12月前
|
机器学习/深度学习 监控 Serverless
无服务器架构(Serverless)
无服务器架构(Serverless)
753 4
|
关系型数据库 MySQL Linux
Linux 安装 mysql【使用yum源进行安装】
这篇文章介绍了在Linux系统中使用yum源安装MySQL数据库的步骤,包括配置yum源、安装MySQL服务、启动服务以及修改root用户的默认密码。
Linux 安装 mysql【使用yum源进行安装】
|
Kubernetes 测试技术 数据安全/隐私保护
如何使用Vcluster实现Kubernetes中的多租户
如何使用Vcluster实现Kubernetes中的多租户
424 0
|
人工智能 运维 机器人
函数计算产品使用问题之怎么使用Serverless Devs创建GPU函数
函数计算产品作为一种事件驱动的全托管计算服务,让用户能够专注于业务逻辑的编写,而无需关心底层服务器的管理与运维。你可以有效地利用函数计算产品来支撑各类应用场景,从简单的数据处理到复杂的业务逻辑,实现快速、高效、低成本的云上部署与运维。以下是一些关于使用函数计算产品的合集和要点,帮助你更好地理解和应用这一服务。
140 0
|
运维 Cloud Native 安全
Serverless是什么
小陈向大刘请教Serverless,了解到Serverless是种云原生开发模式,重点在于FaaS(函数即服务)和BaaS(后端服务),让开发者专注于业务逻辑,而无需管理服务器等基础设施。Serverless并非无服务器,而是将服务器运维工作交给云厂商。FaaS是代码托管服务,例如阿里云的函数计算,提供敏捷、弹性、可靠且成本效益高的计算服务。BaaS则是通过API调用第三方服务,如数据库访问。Serverless与传统架构相比,减少了开发者的负担,提高了效率,降低了成本,并增强了安全性。
2765 6
|
机器学习/深度学习 存储 算法
提升数据中心能效的智能温控策略
【4月更文挑战第17天】 在数据中心的运营管理中,能效优化是一项持续的挑战。随着能源成本的不断上升和对环境影响的日益关注,开发智能且高效的温控系统显得尤为重要。本文提出了一种基于机器学习算法的智能温控策略,该策略通过实时监测数据中心的环境参数并动态调整冷却设备的工作状态,旨在降低能耗并保证系统的稳定运行。通过与传统温控方法进行比较,结果表明,智能温控策略能够有效减少能源消耗并提高整体效率。
|
存储 弹性计算 云计算
云计算 - 弹性计算技术全解与实践
云计算 - 弹性计算技术全解与实践
872 0