通过ACK 节点池高效管理Kubernetes节点——线上,边缘,弹性多种场景

简介: 节点池场景扩展 前言 前面我们介绍了如何通过ACK 节点池管理云上节点资源,以及通过节点池解决的问题。 本文我们介绍通过节点池能够实现的各种场景。   目录 节点池系列将分为几部分介绍ACK Kubernetes 节点池功能和特性 通过ACK 节点池高效管理Kubernetes节点——节点池介绍 通过ACK 节点池高效管理Kubernetes节点

节点池场景扩展

前言

前面我们介绍了如何通过ACK 节点池管理云上节点资源,以及通过节点池解决的问题。 本文我们介绍通过节点池能够实现的各种场景。

 

目录

节点池系列将分为几部分介绍ACK Kubernetes 节点池功能和特性

  • 通过ACK 节点池高效管理Kubernetes节点——节点池介绍
  • 通过ACK 节点池高效管理Kubernetes节点——线上,边缘,弹性多种场景
  • 通过ACK 节点池高效管理Kubernetes节点——降低成本:自动伸缩与抢占实例
  • 通过ACK 节点池高效管理Kubernetes节点——托管节点池:无人工介入的节点自愈恢复
  • 通过ACK 节点池高效管理Kubernetes节点——托管节点池:设置维护窗口与自动升级

 

弹性节点池

弹性伸缩能力是云上降低成本的利器,通过节点池我们能够提前规划好集群的节点配置,基于节点池进行节点的动态扩缩容。 ACK 提供了弹性节点池,将Kubernetes的组件Cluster-AutoScaler和节点池结合,Cluster-AutoScaler监控集群的Pod数和节点数,根据集群中pod使用情况动态伸缩节点池的数量。 当创建一个弹性节点池的时候,时会将对应的伸缩组 ClusterAutoScaler,当集群资源不足, 创建的Pod由于无法调度而出于Pending状态时,ClusterAutoScaler 会触发

托管节点池

Kubernetes 是一个分布式操作系统,分布式系统最大的挑战在于面对失败和不确定性。 随着在kubernetes上运行的工作负载种类越多,不可避免会出现节点层面的异常,例如底层异常,磁盘过满,网络异常导致的节点失联等。 面对这些异常情况我们当然可以手动登陆到节点上执行恢复,但是当维护一个成百上千节点规模的集群时,一台台维护操作肯定不现实,而且每种异常情况对应的恢复操作也不相同,需要有着丰富经验的运维人员24小时待命,这样会带来巨大的运维成本。 同样在运维中,随着Kubernetes和操作系统的演进,集群的节点也需要不定期更新,例如使用最新的内核特性,或者安全布丁,需要更新操作系统版本,或者更新集群的容器运行时等,如何在大规模集群中快速更新同时保障系统的稳定性,也是让运维人员头疼的问题。 托管节点池就是为了解决大规模下的运维问题而设计。 托管节点池的设计思路如下:

  • 支持节点升级,包含操作系统和运行时版本。 相比其他厂商销毁并新建节点的升级方式,ACK 托管节点池通过重置系统盘执行升级,可以节省新建节点的账目成本,同时也能支持预付费场景。
  • 支持配置自动升级。 节点升级会影响集群的算力,很多运维操作会选择在业务低峰的时间段。 托管节点池支持在预设的维护窗口内自动升级,帮助辛苦的运维人员在夜晚能睡一个安稳觉
  • 精细的升级控制,支持MaxUnavailable 和 MaxSurge 等参数,当升级结果不符合预期,通过MaxUnavailable 可以及时终止升级止血,避免扩大影响范围 ; MaxSurge 可以设置升级前额外扩容节点,保障升级过程中算力总量,防止因为节点升级中因为资源不足导致业务无法顺利驱逐。

边缘集群

边缘云计算是基于云计算技术的核心和边缘计算的能力,构筑在边缘基础设施之上的新型计算平台,并正在成为行业的新焦点。阿里云边缘托管Kubernetes集群在云端提供一个标准、安全、高可用的Kubernetes集群,整合阿里云虚拟化、存储、网络和安全等能力,并简化集群运维工作。 https://help.aliyun.com/document_detail/163259.html

ACK边缘集群中,包含两类节点池。 首先是云上节点池,云上节点池部署运行集群管控必须的addon,例如日志,监控,边缘控制器,此外在云ECS上部署 edge-tunnel-server 组件做隧道打通,并通过公网SLB挂载,为边缘节点池创建安全加密的公网运维通道。 边缘节点池每个对应一个EdgeUnit,节点的底层包含ENS和自有边缘节点两种类型。在边缘节点上会部署Edge Agent等组件, 帮助节点扩展边缘节点自治的能力。 参考:https://help.aliyun.com/document_detail/163259.html

混合云节点池

业务上云已是大势所趋,但是对于企业客户而言,出于数据主权和安全隐私的考虑,企业客户会考虑使用多云混合云方式开展业务,然而不同云环境的基础设施能力、安全架构的差异会造成企业IT架构和运维体系的割裂,加大多云混合云实施的复杂性,提高了运维成本。 阿里云容器服务ACK提供的多云混合云方案具有统一的集群管理,动态弹性和服务治理能力。 用户可以将一个线下的Kubernetes集群添加纳管到线上,在纳管的集群中创建云上节点池。 通过节点池能扩缩容云上的ECS节点,并添加到纳管集群中,提供工作负载支持。当出现突发的算力需求,线下来不及扩容,线上弹性节点池就能发挥作用,线上节点池能够通过云上的极速弹性能力提供相应计算资源,及时满足算力需求。

总结

通过节点池能够对ACK 集群提供更细粒度的节点抽象能力,通过支持不同类型的节点池,能够满足线上,边缘等各种场景,在云上也能够通过节点池提供弹性,托管等能力,为用户管理ACK节点提供更低的成本和更好的便捷性。

相关实践学习
深入解析Docker容器化技术
Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上,也可以实现虚拟化,容器是完全使用沙箱机制,相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用,获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道,以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。 在本套课程中,我们将全面的讲解Docker技术栈,从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
目录
相关文章
|
5月前
|
存储 Kubernetes 网络安全
关于阿里云 Kubernetes 容器服务(ACK)添加镜像仓库的快速说明
本文介绍了在中国大陆地区因网络限制无法正常拉取 Docker 镜像的解决方案。作者所在的阿里云 Kubernetes 集群使用的是较旧版本的 containerd(1.2x),且无法直接通过 SSH 修改节点配置,因此采用了一种无需更改 Kubernetes 配置文件的方法。通过为 `docker.io` 添加 containerd 的镜像源,并使用脚本自动修改 containerd 配置文件中的路径错误(将错误的 `cert.d` 改为 `certs.d`),最终实现了通过多个镜像站点拉取镜像。作者还提供了一个可重复运行的脚本,用于动态配置镜像源。虽然该方案能缓解镜像拉取问题,
607 2
|
11月前
|
存储 Kubernetes 监控
K8s集群实战:使用kubeadm和kuboard部署Kubernetes集群
总之,使用kubeadm和kuboard部署K8s集群就像回归童年一样,简单又有趣。不要忘记,技术是为人服务的,用K8s集群操控云端资源,我们不过是想在复杂的世界找寻简单。尽管部署过程可能遇到困难,但朝着简化复杂的目标,我们就能找到意义和乐趣。希望你也能利用这些工具,找到你的乐趣,满足你的需求。
995 33
|
11月前
|
Kubernetes API 网络安全
当node节点kubectl 命令无法连接到 Kubernetes API 服务器
当Node节点上的 `kubectl`无法连接到Kubernetes API服务器时,可以通过以上步骤逐步排查和解决问题。首先确保网络连接正常,验证 `kubeconfig`文件配置正确,检查API服务器和Node节点的状态,最后排除防火墙或网络策略的干扰,并通过重启服务恢复正常连接。通过这些措施,可以有效解决与Kubernetes API服务器通信的常见问题,从而保障集群的正常运行。
894 17
|
11月前
|
存储 人工智能 Kubernetes
ACK Gateway with AI Extension:面向Kubernetes大模型推理的智能路由实践
本文介绍了如何利用阿里云容器服务ACK推出的ACK Gateway with AI Extension组件,在Kubernetes环境中为大语言模型(LLM)推理服务提供智能路由和负载均衡能力。文章以部署和优化QwQ-32B模型为例,详细展示了从环境准备到性能测试的完整实践过程。
|
11月前
|
Kubernetes Shell Windows
【Azure K8S | AKS】在AKS的节点中抓取目标POD的网络包方法分享
在AKS中遇到复杂网络问题时,可通过以下步骤进入特定POD抓取网络包进行分析:1. 使用`kubectl get pods`确认Pod所在Node;2. 通过`kubectl node-shell`登录Node;3. 使用`crictl ps`找到Pod的Container ID;4. 获取PID并使用`nsenter`进入Pod的网络空间;5. 在`/var/tmp`目录下使用`tcpdump`抓包。完成后按Ctrl+C停止抓包。
414 12
|
存储 运维 Kubernetes
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
飞轮科技推出了 Doris 的 Kubernetes Operator 开源项目(简称:Doris Operator),并捐赠给 Apache 基金会。该工具集成了原生 Kubernetes 资源的复杂管理能力,并融合了 Doris 组件间的分布式协同、用户集群形态的按需定制等经验,为用户提供了一个更简洁、高效、易用的容器化部署方案。
632 16
正式开源,Doris Operator 支持高效 Kubernetes 容器化部署方案
|
12月前
|
监控 Kubernetes Cloud Native
基于阿里云容器服务Kubernetes版(ACK)的微服务架构设计与实践
本文介绍了如何基于阿里云容器服务Kubernetes版(ACK)设计和实现微服务架构。首先概述了微服务架构的优势与挑战,如模块化、可扩展性及技术多样性。接着详细描述了ACK的核心功能,包括集群管理、应用管理、网络与安全、监控与日志等。在设计基于ACK的微服务架构时,需考虑服务拆分、通信、发现与负载均衡、配置管理、监控与日志以及CI/CD等方面。通过一个电商应用案例,展示了用户服务、商品服务、订单服务和支付服务的具体部署步骤。最后总结了ACK为微服务架构提供的强大支持,帮助应对各种挑战,构建高效可靠的云原生应用。
|
12月前
|
弹性计算 人工智能 资源调度
DeepSeek大解读系列公开课上新!阿里云专家主讲云上智能算力、Kubernetes容器服务、DeepSeek私有化部署
智猩猩「DeepSeek大解读」系列公开课第三期即将开讲,聚焦阿里云弹性计算助力大模型训练与部署。三位专家将分别讲解智能算力支撑、Kubernetes容器服务在AI场景的应用实践、以及DeepSeek一键部署和多渠道应用集成,分享云计算如何赋能大模型发展。欲观看直播,可关注【智猩猩GenAI视频号】预约。 (239字符)
|
11月前
|
存储 运维 Kubernetes
容器数据保护:基于容器服务 Kubernetes 版(ACK)备份中心实现K8s存储卷一键备份与恢复
阿里云ACK备份中心提供一站式容器化业务灾备及迁移方案,减少数据丢失风险,确保业务稳定运行。
|
人工智能 运维 监控
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。

热门文章

最新文章

推荐镜像

更多