概述
在 Kubernetes 中,不仅容器和 Pod 可以更换,节点也可以更换。Kubernetes 中的节点是 VM、服务器和其他具有计算能力的实体 (其实对k8s来说就是一个对象),在这些实体中运行 Pod 和容器。
节点耗尽是一种允许用户优雅地将所有容器从一个节点移动到其他节点的机制。
例如
- 服务器维护
- k8s 集群的自动缩放(回收节点)
- 云服务的回收机器实现
kubectl drain 背后的原理
Kubernetes 可以自动检测节点故障并将 pod 重新调度到其他节点。以下是不耗尽的情况:
1、节点出现故障——有人按下了服务器上的电源按钮。
2、kube - controller - manager,在 masters 上运行的服务,无法 从 节点上的kubelet获取NodeStatus。默认情况下,它会尝试每 5 秒获取一次状态,它由控制器的 --node - monitor - period参数控制。
3、kube - controller - manager 的另一个重要参数是 --node - monitor - grace - period ,默认为40s。它控制节点被主节点标记为 NotReady 的速度。
4、因此,大约 40 秒后, kubectl get nodes 将其中一个节点显示为 NotReady,但 pod 仍然存在并显示为正在运行。这导致我们进入 --pod-eviction - timeout ,默认为5 分钟。这意味着在节点被标记为 NotReady后,仅在 5 分钟后 Kubernetes 开始驱逐 Pod。
因此,如果有人关闭服务器,那么仅在将近六分钟后(使用默认设置),Kubernetes 开始将 pod 重新调度到其他节点
如何优雅的drain
kubectl cordon
将节点先标记为不可调度.
对于云服务商这时候会给你发短信提示你的ECS即将被释放,看你要不要续费.
kubectl drain
kubectl drain { NODE_NAME } 命令的两个标志需要设置:
kubectl drain ek8s-node-1 --ignore-daemonsets --delete-emptydir-data -- force
– ignore - daemonsets – 无法驱逐在DaemonSet下运行的 pod 。此标志会忽略这些 pod。
– delete - emptydir - data -确认一旦 pod 被驱逐,来自EmptyDir临时存储的数据将消失。
执行 drain 命令后,会发生以下情况:
在 Kubernetes 世界中,它是一个Taint 节点.kubernetes .io / unschedulable :NoSchedule在大多数 pod 节点上会被容忍。
除了属于 DaemonSet 的 Pod,Pod 被逐出并启动在另一个节点上。
Pod 被逐出后,现在可以关闭服务器进行维护了。
参考
【1】drain的使用