深入理解 K8S 资源管理和调度|青训营笔记

本文涉及的产品
容器服务 Serverless 版 ACK Serverless,952元额度 多规格
容器服务 Serverless 版 ACK Serverless,317元额度 多规格
简介: 本篇文章首先讲解K8S的整体架构,介绍各个模块的功能,在此基础上梳理K8S使用各个组件完成项目部署时涉及的资源管理和调度方式

课程资料

课程链接:https://live.juejin.cn/4354/yc_K8S

课程PPT:https://bytedance.feishu.cn/file/boxcnKzeTqE9oymOVKqLtTWzHNb

学员手册:https://juejin.cn/post/7130131931722678308#heading-74

完整手册:https://bytedance.feishu.cn/docx/doxcnECGEFkCKYqbxaDipK1qrVf

一、Kubernetes 简介

几个核心概念

image-20220816152030393

  • Pod
  • PVC/PV/StorageClass
  • Deployment
  • Statefulset
  • Node

Kubernetes架构

image-20220816152350657

  • ETCD

    • 持久化数据中心
    • 维护集群中所有数据的有序性和一致性
    • 事件机制同步数据变更
  • APIServer

    • 对所有组件提供 API 接口
    • 负责 admission,鉴权等功能
    • 提供后端 etcd 数据 cacher,降低 ETCD 压力
    • 结合 ETCD,提供 List-Watch 机制
  • Controller-manager

    • 提供一系列控制器,负责维护各种对象的生命周期 比如: Node controller, PV controller, Deployment controller, StatefulSet controller 等
  • Kubelet

    • 基于 Pod 声明,真正开始启动容器,负责容器生命周期维护
  • Kube-proxy

    • 网络代理,负责维护节点网络规则,接管 Pod 出入流量

二、Kubernetes 资源管理

资源种类

image-20220816153133318

  • 计算类

    • 原生: CPU,memory,等;
    • 可通过 Device plugin 方式支持的非原生: numa,socket...
  • 存储类

    • 原生:

      • 临时存储: Ephemeral storage,EmptyDir 等
      • 持久化 (PV): Cinder, RBD, Cephfs, NFS, GlusterFS...
    • 可以通过 CSI 方式扩展支持其他存储

资源上报

image-20220816153857764

  • 计算资源上报:

    • cAdvisor -> Kubelet -> Node
    • Agent -> Device plugin -> Kubelet -> Node
  • 存储资源上报:

    • 临时存储:

      • cAdvisor -> Kubelet -> Node
    • 持久化存储:

      • 托管到存储提供商管理

资源分配

image-20220816154011489

  • 计算资源分配:

    • Kubelet -> cgroup manager -> cpu, memory...
    • Kubelet -> device manager -> extended resources
  • 存储资源分配:

    • Controller manager -> provisioner -> attacher -> mounter

资源状态维护

image-20220816154306721

  • 计算资源状态维护:

    • kubelet/cgroup manager/device manager/evictioner manager -> cpu, memory, extended resources
  • 存储资源维护

    • PV controller -> PV/PVC

资源回收

image-20220816154427712

  • 计算资源回收:

    • Kubelet -> cgroup manager -> cpu, memory...
    • Kubelet -> device manager -> extended resources
  • 存储资源回收:

    • Controller manager -> unmounter -> detacher -> deleter

三、Kubernetes 调度

约束描述

  • 资源申请:

    • request、limit
  • 其他约束:

    • affinity/anti-affinity
    • Label selector
    • Taint & toleration
    • Image locality
    • Bin-packing/Load balancing...

调度流程

image-20220816154716330

调度框架

image-20220816154803379

主要分为几个步骤:

  • 过滤

    • Pre-Filter: 进行一些全局的准备工作,防止流程中多次重复计算;
    • Filter: 基于 Pod 的约束,进行 Pod -> Node 的匹配工作;
    • Post-Filter: 如果没有一个合适的节点,则进行一些抢占行为(驱逐低优任务),看是否能找到合适节点;
  • 打分

    • 基于前面的过滤节点,对合适的节点进行打分,按照分值高低进行排序;
    • 如果前面没有合适的节点,则直接调度失败;
  • 任务分配

    • Reserve: 在调度器 cache 里面缓存调度结果,为了解决异步 API 操作带来的时延问题;
    • Permit: 扩展接口,可以在这里支持一些扩展语音,比如: Gang 等;

      • 结果有三类: 失败,成功,等待

        • 失败: 直接返回调度失败结果;
        • 成功: 直接通过;
        • 等待: 则异步等待,不阻塞其他流程;
    • Pre-Bind: 任务运行前的一些准备操作,比如: 动态创建 Volume 等;
    • Bind: 把 Pod 绑定到 Node,即: 给应用分配运行节点;

四、小结

Kubernetes 运行 MySql + WordPress 示例:

Kubernetes 与 Yarn 的一些不同点:

  • 基本单位:

    • Yarn: Container;
    • Kubernetes: Pod;
  • 资源管理的扩展能力:

    • Yarn: 没提供 Plugin 机制,侵入性较大;
    • Kubernetes: plugin 机制扩展,侵入性小;
  • 调度模式:

    • Yarn: Node -> Task
    • Kubernetes: Task -> Node
  • 系统设计

    • Yarn: 节点缓存,无核心中心化存储;
    • Kubernetes: 中心化存储;
相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
3月前
|
Kubernetes 监控 调度
Kubernetes Pod调度:从基础到高级实战技巧
Kubernetes Pod调度:从基础到高级实战技巧
542 0
|
26天前
|
Kubernetes 应用服务中间件 调度
云上应用管理问题之如何在Kubernetes集群中配置跨可用区的Pod调度
云上应用管理问题之如何在Kubernetes集群中配置跨可用区的Pod调度
|
1月前
|
分布式计算 资源调度 Hadoop
Hadoop调度和资源管理
【7月更文挑战第14天】
18 2
|
2月前
|
Kubernetes Shell API
技术笔记:K8s中大量Pod是Evicted状态,这是咋回事?
技术笔记:K8s中大量Pod是Evicted状态,这是咋回事?
89 0
|
2月前
|
分布式计算 资源调度 Hadoop
技术好文共享:资源管理与调度系统
技术好文共享:资源管理与调度系统
19 0
|
2月前
|
分布式计算 资源调度 监控
分布式资源管理和调度架构
分布式资源管理和调度架构
|
2月前
|
Kubernetes API 调度
Pod无法调度到可用的节点上(K8s)
完成k8s单节点部署后,创建了一个pod进行测试,后续该pod出现以下报错: Warning FailedScheduling 3h7m (x3 over 3h18m) default-scheduler 0/1 nodes are available: 1 node(s) had untolerated taint {node-role.kubernetes.io/control-plane: }. preemption: 0/1 nodes are available: 1 Preemption is not helpful for scheduling..
158 0
|
3月前
|
Kubernetes 应用服务中间件 调度
k8s-高级调度-污点容忍、亲和性调度
k8s-高级调度-污点容忍、亲和性调度
|
3月前
|
Kubernetes 算法 调度
k8s群集调度之 pod亲和 node亲和 标签指定
k8s群集调度之 pod亲和 node亲和 标签指定
|
3月前
|
Kubernetes Linux 调度
k8s-高级调度-CronJob 计划任务
k8s-高级调度-CronJob 计划任务

热门文章

最新文章