【K8S系列】第九讲:Kubernetes 之探针

简介: 【K8S系列】第九讲:Kubernetes 之探针

一、探针是什么

探针:是由 kubelet 对容器执行的定期诊断

要执行诊断,则需kubelet 调用由容器实现的 Handler。探针有三种类型的处理程序:


ExecAction:在容器内执行指定命令。如果命令退出时返回码为 0 则认为诊断成功。

CPSocketAction:对指定端口上的容器的 IP 地址进行 TCP 检查。如果端口打开,则诊断被认为是成功的。

HTTPGetAction:对指定的端口和路径上的容器的 IP 地址执行 HTTP Get 请求。如果响应的状态码大于等于200 且小于 400,则诊断被认为是成功的。

和微服务的心跳检测类似,每隔一段时间,检测这个容器是否还正常工作,检测状态分为三种,每次检测,都会得到其中一种:


成功:容器通过了诊断。

失败:容器未通过诊断。

未知:诊断失败,因此不会采取任何行动。

k8s会根据检测到的不同状态,对容器进行不同的处理


二、探针类型

探针主要有以下三种类型

  • livenessProbe
  • readinessProbe
  • startupProbe

2.1 livenessProbe

livenessProbe:存活性探针

指检测容器是否正在运行。


1.如果存活探测失败,则 kubelet 会杀死容器(需要注意:杀死的是container不是pod),并且容器将受到其重启策略(Always,OnFailure,Never)的影响。

2.如果容器不提供存活探针,则默认状态为 Success。


2.1.1 容器重启策略

PodSpec 中有一个 restartPolicy 字段,其值可以设置为

Always

OnFailure

Never

默认为 Always

Always:表示一旦不管以何种方式终止运行,kubelet都将重启

OnFailure:表示只有Pod以非0退出码退出才重启

Nerver:表示不再重启该Pod

restartPolicy 适用于 Pod 中的所有容器。

restartPolicy 仅指通过同一节点上的 kubelet 重新启动容器。

失败的容器由 kubelet 以五分钟为上限的指数退避延迟(10秒,20秒,40秒…)重新启动,并在成功执行十分钟后重置。

如 Pod 官方文档中所说,一旦pod绑定到一个节点,Pod 将永远不会重新绑定到另一个节点。


2.2 readinessProbe

readinessProbe:就绪性探针

指示容器是否准备好服务请求【对外接受请求访问】。


1.如果就绪探测失败,端点控制器将从与 Pod 匹配的所有 Service 的端点中删除该 Pod 的 IP 地址IP:Port。

2.初始延迟之前的就绪状态默认为 Failure。

3.如果容器不提供就绪探针,则默认状态为 Success。  

用于判断容器内的程序是否存活,如果不满足健康条件,那么会自动从Service的 EndPoint 列表中去除该pod的 IP:Port


2.3  startupProbe

startupProbe:启动探针,k8s1.16新增加的一种类型

指检测容器中的应用是否已经启动。


1.如果提供了启动探测(startup probe),则禁用所有其他探测,直到它成功为止。

2.如果启动探测失败,kubelet 将杀死容器,容器服从其重启策略进行重启。

3.如果容器没有提供启动探测,则默认状态为成功Success。

主要解决在慢启动程序或复杂程序中readinessProbe、livenessProbe探针无法较好的判断程序是否启动、是否存活。

引入startupProbe探针是为readinessProbe、livenessProbe探针服务。


执行顺序:

1.如果三个探针同时存在,则先执行startupProbe探针,其他两个探针将会被暂时禁用,直到startupProbe一次探测成功,其他2个探针才启动

2.如果startupProbe探测失败,kubelet 将杀死容器,并根据restartPolicy重启策略来判断容器是否要进行重启操作。


2.4 总结

  1. 就绪探针与存活探针之间的重要区别:如果容器未通过准备检查,则不会被终止或重新启动。
  2. 存活探针:通过杀死异常的容器,并用新的正常容器替代他们来保持Pod正常工作
  3. 就绪探针:确保只有准备好处理请求的Pod才可以接收探针请求


2.5 探针示例

探针资源 yml 中的常用的配置,如下。可根据具体的需求去设置

spec:
  containers:
    # 就绪探针
    readinessProbe:
      # 检测方式
      httpGet: 
      # 超时时间
      timeoutSeconds: 
      # 延迟时间
      initialDelaySeconds:
      # 失败次数限制
      failureThreshold:
      # 每多少秒检测一次
      periodSeconds:
    # 存活探针
    livenessProbe:
            # 检测方式
      httpGet: 
      # 超时时间
      timeoutSeconds: 
      # 延迟时间
      initialDelaySeconds:
      # 失败次数限制
      failureThreshold:
      # 每多少秒检测一次
      periodSeconds:


2.6 配置字段介绍

这些字段可以精确的控制存活和就绪检测

initialDelaySeconds:容器启动后要等待多少秒后存活和就绪探测器才被初始化

默认是 0 秒,最小值是 0


periodSeconds:执行探测的时间间隔(单位是秒)

默认是 10 秒。最小值是 1。


timeoutSeconds:探测的超时时间

默认值是 1 秒。最小值是 1。


successThreshold:探测器在失败后,被视为成功的最小连续成功数。

默认值是 1。存活探测的这个值必须是 1。最小值是 1。


failureThreshold:当探测失败时,Kubernetes 的重试次数。存活探测情况下的放弃就意味着重新启动容器。就绪探测情况下的放弃 Pod 会被打上未就绪的标签。

默认值是 3。最小值是 1。  


在 httpGet 上配置额外的字段: 

host:连接使用的主机名,默认是 Pod 的 IP。也可以在 HTTP 头中设置 “Host” 来代替。

scheme :用于设置连接主机的方式(HTTP 还是 HTTPS)。

默认是 HTTP。

path:访问 HTTP 服务的路径。

httpHeaders:请求中自定义的 HTTP 头。HTTP 头字段允许重复。

port:访问容器的端口号或者端口名。如果数字必须在 1 ~ 65535 之间。  


三、探测机制

探测机制有三种:

  • HTTP GET探针
  • TCP套接字探针
  • Exec探针

就绪探针/存活探针,都有这三种探测机制。


3.1 HTTP GET探针

该探针,是针对容器的IP地址(或者是指定的端口和地址)执行HTTP GET请求,状态码:

  1. 如果返回状态码是2xx或者3xx,则探测成功
  2. 如果服务器返回错误的状态码或者根本没有反应,那么认定探测失败,容器会被重新启动。


3.2 TCP套接字探针

TCP套接字探针:尝试与容器指定的端口建立连接

  1. 如果连接成功,则探测成功
  2. 如果连接失败,则认定为探测失败,容器将被重新启动


3.3 Exec探针

Exec探针:在容器内执行任意命令,并检查命令的退出状态码,

  1. 如果返回的状态码为0,则探测成功,
  2. 如果返回状态码不为0,则探测失败,容器将被重新启动。


Tips:

如果是java应用,建议用HTTP GET探针、不推荐使用Exec探针,因为java应用程序会消耗大量的计算资源

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
3月前
|
存储 Kubernetes 网络安全
关于阿里云 Kubernetes 容器服务(ACK)添加镜像仓库的快速说明
本文介绍了在中国大陆地区因网络限制无法正常拉取 Docker 镜像的解决方案。作者所在的阿里云 Kubernetes 集群使用的是较旧版本的 containerd(1.2x),且无法直接通过 SSH 修改节点配置,因此采用了一种无需更改 Kubernetes 配置文件的方法。通过为 `docker.io` 添加 containerd 的镜像源,并使用脚本自动修改 containerd 配置文件中的路径错误(将错误的 `cert.d` 改为 `certs.d`),最终实现了通过多个镜像站点拉取镜像。作者还提供了一个可重复运行的脚本,用于动态配置镜像源。虽然该方案能缓解镜像拉取问题,
396 2
|
9月前
|
存储 Kubernetes 监控
K8s集群实战:使用kubeadm和kuboard部署Kubernetes集群
总之,使用kubeadm和kuboard部署K8s集群就像回归童年一样,简单又有趣。不要忘记,技术是为人服务的,用K8s集群操控云端资源,我们不过是想在复杂的世界找寻简单。尽管部署过程可能遇到困难,但朝着简化复杂的目标,我们就能找到意义和乐趣。希望你也能利用这些工具,找到你的乐趣,满足你的需求。
876 33
|
9月前
|
存储 人工智能 Kubernetes
ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践
本文介绍了如何利用阿里云容器服务ACK推出的ACK Gateway with AI Extension组件,在Kubernetes环境中为大语言模型(LLM)推理服务提供智能路由和负载均衡能力。文章以部署和优化QwQ-32B模型为例,详细展示了从环境准备到性能测试的完整实践过程。
|
11月前
|
存储 运维 Kubernetes
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
飞轮科技推出了 Doris 的 Kubernetes Operator 开源项目(简称:Doris Operator),并捐赠给 Apache 基金会。该工具集成了原生 Kubernetes 资源的复杂管理能力,并融合了 Doris 组件间的分布式协同、用户集群形态的按需定制等经验,为用户提供了一个更简洁、高效、易用的容器化部署方案。
515 16
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
|
10月前
|
监控 Kubernetes Cloud Native
基于阿里云容器服务Kubernetes版(ACK)的微服务架构设计与实践
本文介绍了如何基于阿里云容器服务Kubernetes版(ACK)设计和实现微服务架构。首先概述了微服务架构的优势与挑战,如模块化、可扩展性及技术多样性。接着详细描述了ACK的核心功能,包括集群管理、应用管理、网络与安全、监控与日志等。在设计基于ACK的微服务架构时,需考虑服务拆分、通信、发现与负载均衡、配置管理、监控与日志以及CI/CD等方面。通过一个电商应用案例,展示了用户服务、商品服务、订单服务和支付服务的具体部署步骤。最后总结了ACK为微服务架构提供的强大支持,帮助应对各种挑战,构建高效可靠的云原生应用。
|
10月前
|
弹性计算 人工智能 资源调度
DeepSeek大解读系列公开课上新!阿里云专家主讲云上智能算力、Kubernetes容器服务、DeepSeek私有化部署
智猩猩「DeepSeek大解读」系列公开课第三期即将开讲,聚焦阿里云弹性计算助力大模型训练与部署。三位专家将分别讲解智能算力支撑、Kubernetes容器服务在AI场景的应用实践、以及DeepSeek一键部署和多渠道应用集成,分享云计算如何赋能大模型发展。欲观看直播,可关注【智猩猩GenAI视频号】预约。 (239字符)
|
9月前
|
存储 运维 Kubernetes
容器数据保护:基于容器服务 Kubernetes 版(ACK)备份中心实现K8s存储卷一键备份与恢复
阿里云ACK备份中心提供一站式容器化业务灾备及迁移方案,减少数据丢失风险,确保业务稳定运行。
|
2月前
|
人工智能 算法 调度
阿里云ACK托管集群Pro版共享GPU调度操作指南
本文介绍在阿里云ACK托管集群Pro版中,如何通过共享GPU调度实现显存与算力的精细化分配,涵盖前提条件、使用限制、节点池配置及任务部署全流程,提升GPU资源利用率,适用于AI训练与推理场景。
286 1
|
2月前
|
弹性计算 监控 调度
ACK One 注册集群云端节点池升级:IDC 集群一键接入云端 GPU 算力,接入效率提升 80%
ACK One注册集群节点池实现“一键接入”,免去手动编写脚本与GPU驱动安装,支持自动扩缩容与多场景调度,大幅提升K8s集群管理效率。
254 89
|
7月前
|
资源调度 Kubernetes 调度
从单集群到多集群的快速无损转型:ACK One 多集群应用分发
ACK One 的多集群应用分发,可以最小成本地结合您已有的单集群 CD 系统,无需对原先应用资源 YAML 进行修改,即可快速构建成多集群的 CD 系统,并同时获得强大的多集群资源调度和分发的能力。
290 9

推荐镜像

更多