一、金丝雀发布的由来及含义
1.1 金丝雀发布的由来
金丝雀发布有名灰度发布。起源于17世纪,英国矿井工人发现,金丝雀对瓦斯这种气体十分敏感。空气中哪怕有极其微量的瓦斯,金丝雀也会停止歌唱;而当瓦斯含量超过一定限度时,虽然人类毫无察觉,金丝雀却早已毒发身亡。当时在采矿设备相对简陋的条件下,工人们每次下井都会带上一只金丝雀作为“瓦斯检测指标”,以便在危险状况下紧急撤离。
1.2 金丝雀发布的含义
在金丝雀发布开始后,先启动一个新版本应用,但是并不直接将流量切过来,而是测试人员对新版本进行线上测试,启动的这个新版本应用,就是我们的金丝雀。如果没有问题,那么可以将少量的用户流量导入到新版本上,然后再对新版本做运行状态观察,收集各种运行时数据,如果此时对新旧版本做各种数据对比,就是所谓的A/B测试。
当确认新版本运行良好后,再逐步将更多的流量导入到新版本上,在此期间,还可以不断地调整新旧两个版本的运行的服务器副本数量,以使得新版本能够承受越来越大的流量压力。直到将100%的流量都切换到新版本上,最后关闭剩下的老版本服务,完成金丝雀发布。
如果在金丝雀发布过程中(灰度期)发现了新版本有问题,就应该立即将流量切回老版本上,这样,就会将负面影响控制在最小范围内。
二、金丝雀发布实现
2.1 环境准备
编辑pc_deployment.yaml文件,内容如下
apiVersion: v1
kind: Namespace
metadata:
name: dev
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: pc-deployment
namespace: dev
spec:
replicas: 3
strategy:
type: RollingUpdate
rollingUpdate:
maxUnavailable: 25%
maxSurge: 25%
selector:
matchLabels:
app: nginx-pod
template:
metadata:
labels:
app: nginx-pod
spec:
containers:
- name: nginx
image: nginx:1.17.1
然后使用如下命令创建资源
[root@master pod_controller]# kubectl apply -f pc_deployment.yaml
namespace/dev configured
deployment.apps/pc-deployment configured
[root@master pod_controller]#
查看资源如下所示:
[root@master pod_controller]# kubectl get deploy,rs,pod -n dev
NAME READY UP-TO-DATE AVAILABLE AGE
deployment.apps/pc-deployment 3/3 3 3 2m55s
NAME DESIRED CURRENT READY AGE
replicaset.apps/pc-deployment-5d9c9b97bb 3 3 3 2m55s
NAME READY STATUS RESTARTS AGE
pod/pc-deployment-5d9c9b97bb-brkjg 1/1 Running 0 2m55s
pod/pc-deployment-5d9c9b97bb-kplcw 1/1 Running 0 2m55s
pod/pc-deployment-5d9c9b97bb-wwvqp 1/1 Running 0 2m55s
[root@master pod_controller]#
2.2 金丝雀发布流程
假设将nginx镜像从1.17.1到1.17.3的发布流程采用金丝雀发布流程
使用如下命令进行金丝雀发布,即先创建一个新版本的pod,如此即可以将一部分流量引流到新版本的pod上
[root@master pod_controller]# kubectl set image deployment pc-deployment nginx=nginx:1.17.3 -n dev && kubectl rollout pause deployment pc-deployment -n dev
deployment.apps/pc-deployment image updated
deployment.apps/pc-deployment paused
[root@master pod_controller]#
此时查看资源如下,即1.17.1的pod没动,先新建了一个1.17.3的pod
[root@master pod_controller]# kubectl get deploy,rs,pod -n dev
NAME READY UP-TO-DATE AVAILABLE AGE
deployment.apps/pc-deployment 4/3 1 4 6m8s
NAME DESIRED CURRENT READY AGE
replicaset.apps/pc-deployment-5d9c9b97bb 3 3 3 6m8s
replicaset.apps/pc-deployment-76fd8c7f84 1 1 1 17s
NAME READY STATUS RESTARTS AGE
pod/pc-deployment-5d9c9b97bb-brkjg 1/1 Running 0 6m8s
pod/pc-deployment-5d9c9b97bb-kplcw 1/1 Running 0 6m8s
pod/pc-deployment-5d9c9b97bb-wwvqp 1/1 Running 0 6m8s
pod/pc-deployment-76fd8c7f84-sxcfg 1/1 Running 0 17s
[root@master pod_controller]#
此时,可以将一部分流量在新版本上进行测试,如果测试OK,则继续采用如下命令即可完成完全升级
[root@master pod_controller]# kubectl rollout resume deployment pc-deployment -n dev
deployment.apps/pc-deployment resumed
[root@master pod_controller]#
再次查看资源,发现此时已经完全升级完成,此时三个pod均已切到1.17.3的版本上了
[root@master pod_controller]# kubectl get deploy,rs,pod -n dev
NAME READY UP-TO-DATE AVAILABLE AGE
deployment.apps/pc-deployment 3/3 3 3 8m17s
NAME DESIRED CURRENT READY AGE
replicaset.apps/pc-deployment-5d9c9b97bb 0 0 0 8m17s
replicaset.apps/pc-deployment-76fd8c7f84 3 3 3 2m26s
NAME READY STATUS RESTARTS AGE
pod/pc-deployment-76fd8c7f84-fl2rc 1/1 Running 0 14s
pod/pc-deployment-76fd8c7f84-sxcfg 1/1 Running 0 2m26s
pod/pc-deployment-76fd8c7f84-v8f2p 1/1 Running 0 13s
[root@master pod_controller]#