阿里云 ACK 集群控制器 | 学习笔记

本文涉及的产品
应用型负载均衡 ALB,每月750个小时 15LCU
传统型负载均衡 CLB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
简介: 快速学习阿里云 ACK 集群控制器

开发者学堂课程【企业级运维之云原生与 Kubernets 实战课程:阿里云 ACK 集群控制器 】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/913/detail/14605


阿里云 ACK 集群控制器

目录

Ÿ 控制器列表

Ÿ kube-controller-manager

Ÿ cloud-controller-manager

Ÿ kube-proxy

Ÿ 最佳实践

 

一、 控制器列表

控制平面的组件对集群做出全局决策(比如调度),以及检测和响应集群事件(例如:当不满足部署的 replicas 字段时,启动新的 Pod )。

1. 控制器列表

image.png

2. 控制器分类

image.png

3. Kube-scheduler

Kube-scheduler 是比较常用的控制器组件,负责监听 Kube API server ,比如新创建的、未指定运行节点( Node )的 Pods,并基于其约束和可用资源为这些 Pods选择适合的节点。

调度决策需要考虑的因素:

Ÿ 如何保障每个节点都会被分配,使资源得以高效利用;

Ÿ 调度性能高,可尽快完成大批量调度工作;

Ÿ 允许用户根据自身需求设定调度策略。

 

二、Kube Controller Manager(KCM)

Kube Controller Manager 是 Kubernetes 集群内部资源的管理器,通过 API 服务器监控集群的状态,确保集群处于预期的工作状态。

Kube Controller Manager 由负责不同资源的多个控制器构成,包含:Node Controller、ReplicaSet、Endpoints Controller、Deployment Controller、ServiceAccount&TokenController 等。

1. Node Controller

Node Controller 负责在节点出现故障时进行通知和响应。

2. ReplicaSet Controller

ReplicaSet Controller 负责为系统中的每个副本控制器对象维护正确数量的 Pod。

3. Endpoints Controller

Endpoints Controller 负责填充端点( Endpoints )对象(即加入 Service 与Pod ),比如:如果监测到 Pod 事件(新建或更新),则更新它对应的 Service Endpoints 对象。

4. Deployment Controller

Deployment Controller 负责管理 Deployment 资源。

5. ServiceAccount&TokenController

ServiceAccount&TokenController 负责为新的命名空间创建默认账户和 API 访问令牌。

 

三、Cloud Controller Manager(CCM)

Cloud Controller Manager 提供 Kubernetes 与阿里云基础产品的对接能力,例如 CLB (原 SLB )、VPC 等。

1. CCM 主要功能

CCM 主要提供以下两方面功能:

Ÿ 管理负载均衡

当 Service 的类型设置为 Type=LoadBalancer 时,CCM 组件会为该 Service 创建或配置阿里云负载均衡 CLB ,包括含 CLB 、监听、后端服务器组等资源。当Service 对应的后端 Endpoint 或者集群节点发生变化时,CCM 会自动更新 CLB 的后端虚拟服务器组;

Ÿ 实现跨节点通信

当集群网络组件为 Flannel 时,CCM 组件负责打通容器与节点间网络,实现容器跨节点通信。CCM 会将节点的Pod网段信息写入 VPC 的路由表中,从而实现跨节点的容器通信。该功能无需配置,安装即可使用。

2. CCM 组件

a. Node Controller

Node Controller 用于在节点发生变化时自动更新 CLB 的后端。

b. Route Controller

Route Controller 用于在底层云基础架构中设置路由。

c. Service Controller

Service Controller 用于创建、更新和删除云提供商负载均衡器。

 

四、kube-proxy

kube-proxy 是 Node 上的网络代理组件,以 DamonSet 的形式工作在每一个节点,是实现 Service 负载均衡的控制器。

image.png

kube-proxy 支持 iptables 和 ipvs 两种模式,Kube-proxy 的作用是管理 Service 的 endpoint,更新 endpoint 到 iptables 或 ipvs 中。

ipvs 模式和 iptables 模式之间的差异如下:

Ÿ ipvs 为大型集群提供了更好的可扩展性和性能,当服务大于 1000 时,ipvs 的性能明显优于 iptables;

Ÿ ipvs 支持比 iptables 更复杂的负载平衡算法(最小负载,最少连接,位置,加权等);

Ÿ ipvs 支持服务器健康检查和连接重试等;

因此,目前更推荐使用 ipvs 模式。

 

五、最佳实践

1. 实践场景描述

SLB 设置了 externalTrafficPolicy:Local 类型,这种类型的 SLB 地址只有在 Node 中部署了对应的后端 Pod,才能被访问。因为 SLB 的地址是集群外使用,如果集群节点和 Pod 不能直接访问,请求不会到 SLB,会被当作 Service 的扩展 IP 地址,被 kube-proxy 的 iptables 或 ipvs 转发。

2. 解决方案

方案一:

在 Kubernetes 集群内通过 ClusterIP 或者服务名访问。

方案二:

将 LoadBalancer 的 Service 中的 externalTrafficPolicy 修改为 cluster ,但是在应用中会丢失源 IP,Ingress 的服务修改命令如下:

kubectl edit svc nginx-ingress-b-nkube-system

Ÿ 如果要保留原 IP,Pod 需要用 hostnetwork 方式,在 Pod 的 spec 里加上: dnspolicy: ClusterFirstWithHostNet

hostNetwork: true

service 的 metadata 里加上:

annotations:

servicebeta.kubenetes.io/bACKend-type: eni

Ÿ 如果是 terway 集群,除了将 LoadBalancer 的 Service 中的 externalTrafficPolicy 修改为 Cluster 之外,还要直挂e ni :添加 service.beta.kubernetes.io/bACKend-type: eni

 

本讲小结

1. 集群中核心控制器的基本作用。

2. Kube-proxy 负载均衡的原理。

image.png

思考:

1. 为什么集群内无法访问 service 的 externalIP,该怎么解决?

2. 添加新的节点,Pod 网络不通,该怎么排查?

3. service 的几种类型,kube-proxy 如何实现负载均衡的?

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
2天前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
2天前
|
Kubernetes 算法 调度
阿里云 ACK FinOps成本优化最佳实践
本文源自2024云栖大会梁成昊演讲,讨论了成本优化策略的选择与实施。文章首先介绍了成本优化的基本思路,包括优化购买方式、调整资源配置等基础策略,以及使用弹性、资源混部等高级策略。接着,文章详细探讨了集群优化和应用优化的具体方法,如使用抢占式实例降低成本、通过资源画像识别并优化资源配置,以及利用智能应用弹性策略提高资源利用效率。
|
2天前
|
弹性计算 调度 数据中心
阿里云 ACK One 注册集群云上弹性:扩展业务新利器
随着企业数字化转型深入,传统IDC数据中心因物理容量限制,难以实现动态扩容,缺乏弹性能力。阿里云ACK One注册集群凭借其高度灵活性和丰富资源选择,成为解决此问题的最佳方案。通过与阿里云资源的整合,ACK One不仅实现了计算资源的按需扩展,提高了资源利用率,还通过按需付费模式降低了成本,使企业能够更高效地应对业务增长和高峰需求。
|
2天前
|
运维 Kubernetes Serverless
阿里云Argo X K8s玩转工作流引擎,实现大规模并行计算
本文基于2024云栖大会田双坤的演讲,介绍了Kubernetes作为云原生操作系统的角色及其在各类任务中的应用,重点探讨了Argo Workflows在Kubernetes上编排并行任务的能力。面对自建Argo Workflows的挑战,如稳定性、成本和安全性等问题,阿里巴巴云推出了全托管的Serverless Argo工作流,提供全托管、免运维、可观测和易集成的特点,显著提升了任务编排的效率和稳定性。适用于数据处理、科学计算、自动驾驶仿真等多个领域。
|
2天前
|
Kubernetes 容灾 调度
阿里云 ACK 高可用稳定性最佳实践
本文整理自2024云栖大会刘佳旭的演讲,主题为《ACK高可用稳定性最佳实践》。文章探讨了云原生高可用架构的重要性,通过Kubernetes的高可用案例分析,介绍了ACK在单集群高可用架构设计、产品能力和最佳实践方面的方法,包括控制面和数据面的高可用策略、工作负载高可用配置、企业版容器镜像服务高可用配置等内容,旨在帮助企业构建更加可靠和高效的应用运行环境。
|
2天前
|
存储 Kubernetes 关系型数据库
阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
本文源自2024云栖大会苏雅诗的演讲,探讨了K8s集群业务为何需要灾备及其重要性。文中强调了集群与业务高可用配置对稳定性的重要性,并指出人为误操作等风险,建议实施周期性和特定情况下的灾备措施。针对容器化业务,提出了灾备的新特性与需求,包括工作负载为核心、云资源信息的备份,以及有状态应用的数据保护。介绍了ACK推出的备份中心解决方案,支持命名空间、标签、资源类型等维度的备份,并具备存储卷数据保护功能,能够满足GitOps流程企业的特定需求。此外,还详细描述了备份中心的使用流程、控制台展示、灾备难点及解决方案等内容,展示了备份中心如何有效应对K8s集群资源和存储卷数据的灾备挑战。
|
容器 Kubernetes Perl
阿里云Kubernetes平台构建和管理实践(上)
阿里云智能容器平台解决方案架构师徐征讲解阿里云Kubernetes平台构建和管理实践,徐征主要从事帮助企业在面向云原生的应用转型的过程中提供解决方案和相应的工作。
10901 0
|
容器 Perl 监控
阿里云Kubernetes平台构建和管理实践(下)
阿里云智能容器平台解决方案架构师徐征讲解阿里云Kubernetes平台构建和管理实践,徐征主要从事帮助企业在面向云原生的应用转型的过程中提供解决方案和相应的工作。
3276 0
|
23天前
|
Kubernetes 监控 Cloud Native
Kubernetes集群的高可用性与伸缩性实践
Kubernetes集群的高可用性与伸缩性实践
58 1
|
2月前
|
JSON Kubernetes 容灾
ACK One应用分发上线:高效管理多集群应用
ACK One应用分发上线,主要介绍了新能力的使用场景