Docker 与 K8S学习笔记(二十一)—— Pod生命周期、重启策略与健康检查

简介: Pod在整个生命周期中被系统标示为各种状态,熟悉Pod的各种状态对于理解Pod的调度策略、重启策略很有必要。 一、Pod生命周期 Pod的所处阶段信息保存在PodStatus.Phase,Phase有如下几种值: Pending: API Server已经创建该Pod,但一个或多个容器还没有被创建

Docker 与 K8S学习笔记(二十一)—— Pod生命周期、重启策略与健康检查


Pod在整个生命周期中被系统标示为各种状态,熟悉Pod的各种状态对于理解Pod的调度策略、重启策略很有必要。

 

一、Pod生命周期


Pod的所处阶段信息保存在PodStatus.Phase,Phase有如下几种值:


  • Pending: API Server已经创建该Pod,但一个或多个容器还没有被创建,包括通过网络下载镜像的过程。


  • Running: Pod中的所有容器都已经被创建且已经调度到 Node 上面,但至少有一个容器还在运行或者正在启动。


  • Succeeded: Pod 调度到 Node 上面后均成功运行结束,并且不会重启。


  • Failed: Pod中的所有容器都被终止了,但至少有一个容器退出失败(即退出码不为 0 或者被系统终止)。


  • Unknonwn: 状态未知,因为一些原因Pod无法被正常获取,通常是由于 apiserver 无法与 kubelet 通信导致。


Pod的生命周期示意图如下:


 

大家可以看到,Phase记录的是Pod在其生命周期中的简单宏观概述。该阶段并不是对容器或Pod的综合汇总,也不是为了作为综合状态机,我们举个例子理解一下:


$ sudo kubectl create -f webapp_pod.yaml
pod/webapp created
$ sudo kubectl get pod
NAME     READY   STATUS              RESTARTS   AGE
webapp   0/2     ContainerCreating   0          3s
$ sudo kubectl get pod webapp -o jsonpath="{.status.phase}"
Pending


我们可以看到当创建Pod时,我们通过get pod能看到Pod状态为ContainerCreating,通过phase看到Pod所处的阶段是Pending,所以Phase描述Pod更为宏观的状态。

 

二、Pod重启策略


Pod的重启策略应用与Pod内所有容器,并且仅在Pod所处的Node上由kubelet进行判断和操作,当某个容器异常退出或者健康检查失败时,kubelet将根据RestartPolicy进行对应操作。


Pod重启策略如下:


  • Always:当容器退出时,无论失败与否都重启


  • OnFailure:当容器终止运行且退出码不为零,则重启


  • Never:无论容器状态如何,都不重启


Pod重启策略与控制方式息息相关,可管理Pod的控制器有:RC、Job、DaemonSet、kubelet(静态Pod)等,每种控制器对Pod的重启策略要求如下:


  • RC和DaemonSet:必须设置为Always,确保容器持续运行


  • Job:可设置为OnFailure或Never,确保容器执行完成后释放资源不再重启


  • kubelet:不论设置什么样的重启策略,其在Pod失效时都会自动重启


结合Pod的生命周期和重启策略,我们可得出下表中Pod状态切换过程:


Pod容器数 Pod当前阶段 发生事件 Pod不同重启策略下的结果状态
Always OnFailure Never
1个容器 Running 容器正常退出 Running Successed Successed
1个容器 Running 容器退出失败 Running Running Failed
2个容器 Running 1个容器退出失败 Running Running Running
2个容器 Running 容器被OOM杀掉 Running Running Failed

 

三、Pod健康检查


Kubernetes对Pod的健康检查可通过三类探针来完成:


  • LivenessProbe:探测容器是否正在运行。如果探测容器不健康,则 kubelet 会杀死容器, 并且容器将根据其重启策略决定后续操作。如果容器不包含此探针, 则默认状态为 Success。


  • ReadinessProbe:探测容器是否准备好为请求提供服务。如果就探测失败, 系统将从与 Pod 匹配的所有服务的EndPoint列表中删除该 Pod 的 IP 地址。如果容器不包含此探针,则默认状态为 Success。


  • StartupProbe: 探测容器中的应用是否已经启动。如果提供了此探针,则所有其他探针都会被禁用,直到此探针成功为止。如果探测失败,kubelet 将杀死容器,然后容器按照其重启策略进行后续操作。如果容器不包含此探测,则默认状态为 Success。


以上探针均可配置以下三种实现方式:


  • ExecAction:在容器内执行指定命令。如果命令退出码为 0 则认为诊断成功。


  • TCPSockerAction:对容器的 IP 地址上的指定端口执行 TCP 检查。如果端口打开,则诊断被认为是成功的。


  • HTTPGetAction:对容器的 IP 地址上指定端口和URL执行 Get 请求。如果响应的状态码大于等于 200 且小于 400,则诊断被认为是成功的。


每次探测都将获得以下三种结果之一:


  • Success(成功):容器通过了诊断。


  • Failure(失败):容器未通过诊断。


  • Unknown(未知):诊断失败,因此不会采取任何行动。


分类: 容器技术

相关实践学习
容器服务Serverless版ACK Serverless 快速入门:在线魔方应用部署和监控
通过本实验,您将了解到容器服务Serverless版ACK Serverless 的基本产品能力,即可以实现快速部署一个在线魔方应用,并借助阿里云容器服务成熟的产品生态,实现在线应用的企业级监控,提升应用稳定性。
云原生实践公开课
课程大纲 开篇:如何学习并实践云原生技术 基础篇: 5 步上手 Kubernetes 进阶篇:生产环境下的 K8s 实践 相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
28天前
|
运维 Kubernetes 监控
Kubernetes详解(十九)——Kubernetes Pod控制器
Kubernetes详解(十九)——Kubernetes Pod控制器
42 3
|
21天前
|
容器 Perl Kubernetes
深入 Kubernetes 网络:实战K8s网络故障排查与诊断策略
本文介绍了Kubernetes网络的基础知识和故障排查经验,重点讨论了私有化环境中Kubernetes网络的挑战。首先,文章阐述了Kubernetes网络模型的三大核心要素:Pod网络、Service网络和CNI,并强调了其在容器通信和服务发现中的作用。接着,通过三个具体的故障案例,展示了网络冲突、主节点DNS配置更改导致的服务中断以及容器网络抖动问题的解决过程,强调了网络规划、配置管理和人员培训的重要性。最后,提到了KubeSkoop exporter工具在监控和定位网络抖动问题中的应用。通过这些案例,读者可以深入了解Kubernetes网络的复杂性,并学习到实用的故障排查方法。
146234 18
|
6天前
|
Kubernetes API 调度
Pod无法调度到可用的节点上(K8s)
完成k8s单节点部署后,创建了一个pod进行测试,后续该pod出现以下报错: Warning FailedScheduling 3h7m (x3 over 3h18m) default-scheduler 0/1 nodes are available: 1 node(s) had untolerated taint {node-role.kubernetes.io/control-plane: }. preemption: 0/1 nodes are available: 1 Preemption is not helpful for scheduling..
29 0
|
10天前
|
Kubernetes 应用服务中间件 API
docker-desktop启动k8s
docker-desktop启动k8s
21 0
|
24天前
|
Kubernetes 算法 调度
k8s群集调度之 pod亲和 node亲和 标签指定
k8s群集调度之 pod亲和 node亲和 标签指定
|
25天前
|
运维 Prometheus 监控
Kubernetes 集群的监控与维护策略
【5月更文挑战第30天】 在微服务架构日益普及的背景下,容器编排工具如Kubernetes成为确保服务高效运行的关键。本文聚焦于Kubernetes集群的监控和维护,首先探讨了监控系统的重要性及其对集群健康的影响,随后详细介绍了一套综合监控策略,包括节点性能监控、应用服务质量跟踪以及日志管理等方面。此外,文章还提出了一系列实用的集群维护技巧和最佳实践,旨在帮助运维人员预防故障发生,快速定位问题,并确保集群长期稳定运行。
|
25天前
|
存储 运维 Kubernetes
Kubernetes 集群的持续性能优化策略
【5月更文挑战第30天】 在动态且日益复杂的云计算环境中,保持 Kubernetes 集群的高性能和稳定性是一个持续的挑战。本文将探讨一系列实用的性能优化策略,旨在帮助运维专家识别并解决可能影响集群性能的问题。我们将从节点资源配置、网络优化、存储管理以及集群监控等方面入手,提供一系列经过实践检验的调优技巧,并分享最佳实践案例。这些策略不仅有助于提升现有集群的性能,也为规划新的 Kubernetes 部署提供了参考依据。
|
26天前
|
机器学习/深度学习 存储 监控
Kubernetes 集群的持续监控与性能优化策略深度学习在图像识别中的应用与挑战
【5月更文挑战第29天】 在当今微服务架构和容器化部署的大背景下,Kubernetes 已成为众多企业的首选平台。然而,随着集群规模的扩大和业务复杂性的增加,如何确保系统的高可用性和性能稳定性成为一个挑战。本文将探讨针对 Kubernetes 集群实施的持续监控方案以及针对性能瓶颈的优化策略,旨在帮助运维人员有效管理和提升其服务的质量。
|
26天前
|
运维 监控 持续交付
构建高效自动化运维系统:基于Docker Swarm的策略与实践
【5月更文挑战第29天】 在现代企业IT基础架构管理中,自动化运维已成为提升效率、确保稳定性的关键因素。本文通过探讨基于Docker Swarm的集群管理和自动化部署策略,旨在为读者提供一个构建和维护高效自动化运维系统的全面视角。文章不仅涵盖了Docker Swarm的基础概念和关键特性,还深入分析了如何结合持续集成/持续部署(CI/CD)流程,实现无人工干预的服务部署和横向扩展。此外,文中也讨论了监控、日志和故障恢复等运维实践,以期帮助读者构建一个既可靠又灵活的自动化运维平台。
|
28天前
|
运维 监控 Kubernetes
构建高效稳定的云基础设施:自动化运维在企业级应用中的关键实践Kubernetes集群监控与性能优化策略
【5月更文挑战第27天】 随着云计算技术的不断成熟和企业数字化转型的深入,构建一个高效、稳定且可扩展的云基础设施已成为众多组织的核心诉求。本文将重点探讨自动化运维在实现这一目标中的重要作用,通过案例分析展示自动化工具和策略如何优化资源管理、提升服务响应速度以及降低运营成本。文章还将讨论自动化过程中面临的挑战,如安全性、复杂性管理和人员技能提升,并提供针对性的解决方案。