Knativa 基于流量的灰度发布和自动弹性实践

简介: Knative 提供了基于流量的自动扩缩容能力,可以根据应用的请求量,在高峰时自动扩容实例数;当请求量减少以后,自动缩容实例,做到自动化地节省资源成本。此外,Knative 还提供了基于流量的灰度发布能力,可以将流量的百分比进行灰度发布。

头图.jpg

作者 | 李鹏(元毅)
来源 | Serverless 公众号

一、Knative

Knative 提供了基于流量的自动扩缩容能力,可以根据应用的请求量,在高峰时自动扩容实例数;当请求量减少以后,自动缩容实例,做到自动化地节省资源成本。此外,Knative 还提供了基于流量的灰度发布能力,可以将流量的百分比进行灰度发布。

在介绍 Knative 灰度发布和自动弹性之前,先带大家了解一下 ASK Knative 中的流量请求机制。

1.jpg

如上图所示,整体的流量请求机制分为以下部分:

  • 左侧是 Knative Service 的版本信息,可以对流量设置百分比;下面是路由策略,在路由策略里,通过 Ingress controller 将相应的路由规则设置到阿里云 SLB;
  • 右侧是对应创建的服务版本 Revision,在版本里对应有 Deployment 的资源,当流量通过 SLB 进来之后,直接根据相应的转发规则,转到后端服务器 Pod 上。

除了流量请求机制外,上图还展示了相应的弹性策略,如 KPA、HPA 等。

二、Service 生命周期

Service 是直接面向开发者操作的资源对象,包含两部分的资源:Route 和 Configuration。

2.jpg

如上图所示,用户可以通过配置 Configuration 里面的信息,设置相应的镜像、内容以及环境变量信息。

1. Configuration

3.jpg

Configuration 是:

  • 管理容器期望的状态;
  • 类似版本控制器,每次更新 Configuration 都会创建新的版本(Revision)。

如上图所示,与 Knative Service 相比较,Configuration 和它的配置很接近,Configuration 里配置的就是容器期望的资源信息。

2. Route

4.jpg

Route 可以:

  • 控制流量分发到不同的版本(Revision);
  • 支持按照百分比进行流量分发。

如上图所示,一个 Route 资源,下面包括一个 traffic 信息,traffic 里面可以设置对应的版本和每个版本对应的流量比例。

3. Revision

5.jpg

  • 一个 Configuration 的快照;
  • 版本追踪、回滚。

Knative Service 中版本管理的资源:Revision,它是 Configuration 的快照,每次更新 Configuration 就会创建一个新的 Revision,可以通过 Revision 实现版本追踪、灰度发布以及回滚。在 Revision 资源里面,可以直接地看到配置的镜像信息。

三、基于流量的灰度发布

6.jpg

如上图所示,假如一开始我们创建了 V1 版本的 Revision,这时如果有新的版本变更,那么我们只需要更新 Service 中的 Configuration,就会相应的创建出 V2 版本。然后通过 Route 对 V1 和 V2 设置不同的流量比例,上图中 V1 是 70%,V2 是 30%,流量会按照 7:3 的比例分别分发到两个版本上。一旦 V2 版本验证没有问题,接下来就可以通过调整流量比例的方式进行继续灰度,直到新的版本 V2 达到 100%。

在灰度的过程中,一旦发现新版本有异常,随时可以调整流量比例进行回滚。假设灰度到 30% 的时候,发现 V2 版本有问题,我们就可以把比例调回去,在原来的 V1 版本上设置流量 100%,实现回滚操作。

除此之外,我们还可以在 Route 中通过 traffic 对 Revision 打上一个 Tag,打完 Tag 之后,在 Knative 中会自动对当前的 Revision 生成一个可直接访问的 URL,通过这个 URL 我们可以直接把相应的流量打到当前的某一个版本上去,这样可以实现对某个版本的调试。

四、自动弹性

在 Knative 中提供了丰富的弹性策略,除此之外,ASK Knative 中还扩展了一些相应的弹性机制,接下来分别介绍以下几个弹性策略:

  • Knative Pod 自动扩缩容 (KPA);
  • Pod 水平自动扩缩容 (HPA);
  • 支持定时 + HPA 的自动扩缩容策略;
  • 事件网关(基于流量请求的精准弹性);
  • 扩展自定义扩缩容插件。

1. 自动扩缩容-KPA

7.jpg

图:Knative Pod 自动扩缩容(KPA)

如上图所示,Route 可以理解成流量网关;Activator 在 Knative 中承载着 0~1 的职责,当没有请求流量时, Knative 会把相应的服务挂到 Activator Pod 上面,一旦有第一个流量进来,首先会进入到 Activator,Activator 收到流量之后,会通过 Autoscaler 扩容 Pod,扩容完成之后 Activator 把请求转发到相应的 Pod 上去。一旦 Pod ready 之后,那么接下来相应的服务会通过 Route 直接打到 Pod 上面去,这时 Activator 已经结束了它的使命。

在 1~N 的过程中,Pod 通过 kube-proxy 容器可以采集每个 Pod 里面的请求并发指数­,也就是请求指标。Autoscaler 根据这些请求指标进行汇聚,计算相应的需要的扩容数,实现基于流量的最终扩缩容。
 

2. 水平扩缩容-HPA

8.jpg

图:Pod 水平自动扩缩容(HPA)

它其实是将 K8s 中原生的 HPA 做了封装,通过 Revision 配置相应的指标以及策略,使用 K8s 原生的 HPA,支持 CPU、Memory 的自动扩缩容。

3. 定时+HPA 融合

9.jpg

  • 提前规划容量进行资源预热;
  • 与 CPU、Memory 进行结合。

在 Knative 之上,我们将定时与 HPA 进行融合,实现提前规划容量进行资源预热。我们在使用 K8s 时可以体会到,通过 HPA 进行扩容时,等指标阈值上来之后再进行扩容的话,有时满足不了实际的突发场景。对于一些有规律性的弹性任务,可以通过定时的方式,提前规划好某个时间段需要扩容的量。

我们还与 CPU、Memory 进行结合。比如某个时间段定时设置为 10 个 Pod,但是当前 CPU 对阈值计算出来需要 20 个 Pod,这时会取二者的最大值,也就是 20 个 Pod 进行扩容,这是服务稳定性的最基本保障。

4. 事件网关

10.jpg

  • 基于请求数自动弹性;
  • 1 对 1 任务分发。

事件网关是基于流量请求的精准弹性。当事件进来之后,会先进入到事件网关里面,我们会根据当前进来的请求数去扩容 Pod,扩容完成之后,会产生将任务和 Pod 一对一转发的诉求。因为有时某个 Pod 同一时间只能处理一个请求,这时候我们就要对这种情况进行处理,也就是事件网关所解决的场景。

5. 自定义扩缩容插件

11.jpg

自定义扩缩容插件有 2 个关键点:

  • 采集指标;
  • 调整 Pod 实例数。

指标从哪来?像 Knative 社区提供的基于流量的 KPA,它的指标是通过一个定时的任务去每个 Pod 的 queue-proxy 容器中拉取 Metric 指标。通过 controller 对获取这些指标进行处理,做汇聚并计算需要扩容多少 Pod。
怎么执行扩缩容?其实通过调整相应的 Deployment 里面的 Pod 数即可。

调整采集指标和调整 Pod 实例数,实现这两部分后就可以很容易地实现自定义扩缩容插件。

五、实操演示

下面进行示例演示,演示内容主要有:

  • 基于流量的灰度发布
  • 基于流量的自动扩缩容

演示过程观看链接:https://developer.aliyun.com/live/246127

作者简介:
李鹏,花名:元毅,阿里云容器平台高级开发工程师,2016 年加入阿里, 深度参与了阿里巴巴全面容器化、连续多年支持双十一容器化链路。专注于容器、Kubernetes、Service Mesh 和 Serverless 等云原生领域,致力于构建新一代 Serverless 平台。当前负责阿里云容器服务 Knative 相关工作。

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
数据可视化 大数据 物联网
【专访蓝景科技】5G+实时云渲染赋能数字孪生,共建元宇宙
而同时,近年来,数字孪生技术被认为是具有战略性、颠覆性、先导性的技术,其应用场景已深入到城市治理、智慧园区、工业制造、医疗健康等新型智慧城市建设的方方面面,随着“探索建设数字孪生城市”被写入“十四五”规划纲要中,数字孪生技术已成为是构建新型智慧城市的重要技术手段。元宇宙和数字孪生都是信息化发展到一定程度的必然结果,二者之间既有不同之处,又深度融合。
【专访蓝景科技】5G+实时云渲染赋能数字孪生,共建元宇宙
|
云安全 安全 小程序
无影-阿里云第一款云电脑,它拥有超越PC的完美体验
无影是一款面向数字经济时代的生产力工具,基于流式传输服务和容器化架构,可实现随时随地云上办公、海量算力触手可得、海量应用一网打尽,依托阿里云打造云管端一体化安全防护体系,全面保障企业业务和数据安全,拥有超越PC的便捷、流畅、安全、高效体验。
27678 0
无影-阿里云第一款云电脑,它拥有超越PC的完美体验
|
弹性计算 网络协议 应用服务中间件
自学软硬件工程师第751天域名和公网ip怎么绑定
自学软硬件工程师第751天域名和公网ip怎么绑定
|
机器学习/深度学习 消息中间件 监控
监控工具实现实时监测的方法
监控工具实现实时监测的方法
745 11
|
传感器 存储 物联网
新技术趋势与应用:区块链、物联网和虚拟现实的融合创新
在数字化浪潮中,区块链技术以其不可篡改的特性成为信任的基石;物联网技术通过智能设备的互联互通,将物理世界数字化;而虚拟现实技术则打造沉浸式体验,模糊现实与虚拟的边界。这三者的结合预示着一个高度互联、智能化且富有创造力的未来,其中区块链确保数据安全,物联网提供实时数据,虚拟现实则为用户带来前所未有的交互体验。本文将探讨这些技术的发展趋势和潜在应用场景,并展示它们如何共同塑造未来社会的面貌。
315 5
|
人工智能 安全 算法
2024数博会,阿里云获科技大奖、多个项目入选国家数据局案例
近日,第十届中国国际大数据产业博览会在贵阳正式开幕。本次展会,阿里云飞天企业版荣获大会“十大科技领先成果”奖项,小鹏汽车与阿里云开展的“全国一体化算力网”应用实践以及阿里云参建的“车路云一体化”项目分别入选国家数据局典型案例。
437 3
|
机器学习/深度学习 人工智能 计算机视觉
使用Python实现简单的图像识别应用
本文介绍了如何使用Python编写一个简单的图像识别应用程序。通过结合Python的图像处理库和机器学习库,我们可以轻松地构建一个能够识别特定物体或图案的程序。本文将从安装必要的库开始,然后逐步介绍如何编写代码来实现图像的加载、处理和识别。
|
存储 物联网 编译器
详解【C语言】类型转换--整型提升,算术
详解【C语言】类型转换--整型提升,算术
440 0
|
SQL 监控 物联网
阿里云物联网平台数字孪生功能Quick Start
数字孪生是物理世界的数字化呈现,可通过构建孪生体来描述设备、流程、系统、场景等业务模型,对物理世界实体信息进行实时采集、运算分析、监控统计等,助您更精准地掌握业务模型动态变化,进而实现对实际生产过程的提效和降本目的。本文从产品创建开始,一步一步演示如何使用物联网平台的数字孪生功能。
16716 0
阿里云物联网平台数字孪生功能Quick Start