在 Kubernetes (k8S) 中,Pod 被调度到一个节点的具体过程可以分为以下步骤:
- 创建 Pod
- 用户通过
kubectl apply
或 Kubernetes API Server 创建或更新 Pod 的 YAML 配置文件。 - Kubernetes API Server 接收到创建 Pod 的请求后,会验证该请求的正确性和有效性。
- 准入控制
- 在 API Server 确认请求有效之后,它会将这个待创建的 Pod 信息传递给准入控制器(Admission Controllers)进行进一步处理和校验。这些控制器可能包括 Namespace 生命周期、ResourceQuota、ServiceAccount 等控制器,以及用户自定义的准入 webhook 控制器,用于执行特定策略。
- Pending 状态
- 当 Pod 通过了所有准入控制阶段后,API Server 将其存储在 etcd 中,并标记为“Pending”状态,此时 Pod 没有被分配到任何具体的节点上。
- 调度
- kube-scheduler 组件通过监听 API Server 来发现处于 Pending 状态的 Pod。
- kube-scheduler 使用一组预定义的调度算法和策略对集群中的各个节点进行评估,以确定最适合运行该 Pod 的节点。这一过程包括:
- 过滤(Filtering):kube-scheduler 根据资源需求、亲和性/反亲和性规则、NodeSelector、Taints 和 Tolerations 等约束条件过滤出符合条件的节点列表。
- 打分(Scoring):对通过过滤阶段的节点按照不同的评分标准进行打分,如资源利用率、污点容忍度等,选择得分最高的节点。
- 绑定
- 当 kube-scheduler 选择出最佳节点后,它会在 API Server 中将该 Pod 与所选节点绑定,即设置 Pod 的
.spec.nodeName
字段为选定节点的名称。 - API Server 更新 Pod 状态,并通知 kubelet 组件。
- kubelet 初始化 Pod
- 相应节点上的 kubelet 从 API Server 获取到已绑定到本节点的新 Pod 信息。
- kubelet 根据 Pod 的具体配置下载所需的容器镜像,准备并挂载卷,然后调用容器运行时(如 Docker 或 containerd)来启动 Pod 中的所有容器。
- Pod 运行
- 当容器成功启动并且健康检查(如果配置了的话)通过后,Pod 进入“Running”状态,在所选节点上开始正常工作。
综上所述,整个调度流程体现了 Kubernetes 对于应用弹性伸缩和资源优化的核心能力,确保了 Pod 能够根据集群资源状况和用户指定的调度策略高效地部署和运行。