容器服务ACK常见问题之线上的K8s一直waiting如何解决

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 容器服务ACK(阿里云容器服务 Kubernetes 版)是阿里云提供的一种托管式Kubernetes服务,帮助用户轻松使用Kubernetes进行应用部署、管理和扩展。本汇总收集了容器服务ACK使用中的常见问题及答案,包括集群管理、应用部署、服务访问、网络配置、存储使用、安全保障等方面,旨在帮助用户快速解决使用过程中遇到的难题,提升容器管理和运维效率。

问题一:在容器服务ACK把线上线下的K8s都加到了rancher,但是线上的一直是waiting,怎么办?

在容器服务ACK把线上的,和线下的K8s,都加到了rancher,但是线上的,一直是waiting,有什么办法解决吗?

线上这个,打不开仪表盘



参考答案:

当您在容器服务ACK中将线上和线下的Kubernetes集群都添加到Rancher时,如果当您在容器服务ACK中将线上和线下的Kubernetes集群都添加到Rancher时,如果线上的集群一直处于等待状态,可能是由于以下原因之一:

  1. 集群配置问题:请确保您的线上Kubernetes集群的配置与Rancher的要求相匹配。您可以检查Rancher官方文档中的“Adding a Cluster”部分,以获取有关如何正确配置集群的信息。
  2. 网络连接问题:如果您的线上Kubernetes集群位于不同的网络环境中,则可能需要进行一些额外的配置才能使Rancher能够访问它。例如,您可能需要设置防火墙规则或VPN连接等。
  3. 权限问题:请确保您具有足够的权限来添加和管理Kubernetes集群。如果您没有足够的权限,请联系您的系统管理员以获取帮助。

为了解决这个问题,您可以尝试以下步骤:

  1. 检查您的线上Kubernetes集群的配置是否正确,并与Rancher的要求相匹配。
  2. 确保您的线上Kubernetes集群可以访问Rancher所在的网络环境。
  3. 检查您的权限设置,并确保您具有足够的权限来添加和管理Kubernetes集群。
  4. 如果以上步骤都无法解决问题,请联系Rancher官方支持团队以获取更多帮助。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/578696?spm=a2c6h.12873639.article-detail.72.78734378QzkArw



问题二:在容器服务ACK两个ack集群之间能实现互通吗?

在容器服务ACK两个ack集群之间能实现互通吗?



参考答案:

参考https://help.aliyun.com/zh/ack/distributed-cloud-container-platform-for-kubernetes/user-guide/mcs-overview?spm=a2c4g.11186623.4.5.6b7036c8c0lSC8&scm=20140722.H_440680._.ID_440680-OR_rec-V_1 



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/578695?spm=a2c6h.12873639.article-detail.73.78734378QzkArw



问题三:容器服务ACK的ecs怎么自动扩?

容器服务ACK的ecs怎么自动扩?



参考答案:

看文档描述,针对 Pending状态的Pod 而触发扩容ecs。 https://help.aliyun.com/zh/ack/ack-managed-and-ack-dedicated/user-guide/auto-scaling-of-nodes?spm=a2c4g.11186623.0.0.3a4d67afrgBt0O 



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/578694?spm=a2c6h.12873639.article-detail.74.78734378QzkArw



问题四:容器服务ACK没有master,怎么可以加入rancher呀?

容器服务ACK没有master,怎么可以加入rancher呀?



参考答案:

把rancher生成的config url,在ack界面下用 cloud shell,去执行。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/578693?spm=a2c6h.12873639.article-detail.75.78734378QzkArw



问题五:在容器服务ACK当某些worker 节点 cpu/mem 等很高的场景,怎么处理? 自己手动扩容?

在容器服务ACK看文档描述 针对 Pending状态的Pod 而触发扩容,

那么当某些worker 节点 cpu/mem 等很高的场景,怎么处理? 自己手动扩容?



参考答案:

在容器服务ACK中,如果某些worker节点的CPU、内存等资源使用率很高,您可以利用节点池的扩缩容功能来自动增加或减少节点数量。具体来说,ACK通过调整节点池的期望节点数来实现节点池的扩缩容,将节点数目维持在期望数量,从而保证节点数量足够支撑业务运行,或者在业务需求下降时节省成本。

当需要手动扩容时,如果有多个可扩容的节点池,您可以根据实际需求选择其中任意一个进行扩容。例如,您可能希望选择资源浪费最少的节点池进行扩容,以提升资源利用率。此外,针对多可用区的场景,容器服务ACK还引入了ack-autoscaling-placeholder组件,该组件通过少量的资源冗余方式,将多可用区的弹性伸缩问题转变为并发节点池的定向伸缩问题。

另外,如果您发现云盘使用空间不足,ACK还提供了自动扩容云盘数据卷的功能。通过定义一种或多种扩容策略,当数据卷的使用率高于某个阈值时,系统会自动进行扩容。这样不仅可以避免因磁盘空间不足而导致的业务中断,同时也提高了系统的可用性和运维效率。



关于本问题的更多回答可点击进行查看:

https://developer.aliyun.com/ask/578692?spm=a2c6h.12873639.article-detail.76.78734378QzkArw

相关实践学习
通过Ingress进行灰度发布
本场景您将运行一个简单的应用,部署一个新的应用用于新的发布,并通过Ingress能力实现灰度发布。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
28天前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
14天前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
6天前
|
人工智能 运维 监控
容器服务Kubernetes场景下可观测体系生产级最佳实践
阿里云容器服务团队在2024年继续蝉联Gartner亚洲唯一全球领导者象限,其可观测体系是运维的核心能力之一。该体系涵盖重保运维、大规模集群稳定性、业务异常诊断等场景,特别是在AI和GPU场景下提供了全面的观测解决方案。通过Tracing、Metric和Log等技术,阿里云增强了对容器网络、存储及多集群架构的监控能力,帮助客户实现高效运维和成本优化。未来,结合AI助手,将进一步提升问题定位和解决效率,缩短MTTR,助力构建智能运维体系。
|
28天前
|
存储 Kubernetes 关系型数据库
阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
本文源自2024云栖大会苏雅诗的演讲,探讨了K8s集群业务为何需要灾备及其重要性。文中强调了集群与业务高可用配置对稳定性的重要性,并指出人为误操作等风险,建议实施周期性和特定情况下的灾备措施。针对容器化业务,提出了灾备的新特性与需求,包括工作负载为核心、云资源信息的备份,以及有状态应用的数据保护。介绍了ACK推出的备份中心解决方案,支持命名空间、标签、资源类型等维度的备份,并具备存储卷数据保护功能,能够满足GitOps流程企业的特定需求。此外,还详细描述了备份中心的使用流程、控制台展示、灾备难点及解决方案等内容,展示了备份中心如何有效应对K8s集群资源和存储卷数据的灾备挑战。
|
2月前
|
Kubernetes Nacos 微服务
探讨了在Kubernetes中使用Nacos v2.2.3时,强制删除Pod后Pod仍存在的常见问题
本文深入探讨了在Kubernetes中使用Nacos v2.2.3时,强制删除Pod后Pod仍存在的常见问题。通过检查Pod状态、事件、配置,调整Nacos和Kubernetes设置,以及手动干预等步骤,帮助开发者快速定位并解决问题,确保服务稳定运行。
74 2
|
2月前
|
存储 运维 Kubernetes
云端迁移:备份中心助力企业跨云迁移K8s容器服务平台
本文将简要介绍阿里云容器服务ACK的备份中心,并以某科技公司在其实际的迁移过程中遇到具体挑战为例,阐述如何有效地利用备份中心来助力企业的容器服务平台迁移项目。
|
4月前
|
人工智能 Prometheus 监控
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
本文介绍了在阿里云容器服务 ACK 上部署 NVIDIA NIM,结合云原生 AI 套件和 KServe 快速构建高性能模型推理服务的方法。通过阿里云 Prometheus 和 Grafana 实现实时监控,并基于排队请求数配置弹性扩缩容策略,提升服务稳定性和效率。文章提供了详细的部署步骤和示例,帮助读者快速搭建和优化模型推理服务。
220 7
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
|
4月前
|
存储 Kubernetes 关系型数据库
阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
阿里云ACK备份中心,K8s集群业务应用数据的一站式灾备方案
|
4月前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
阿里云ACK容器服务生产级可观测体系建设实践
|
5月前
|
弹性计算 Kubernetes Serverless
Kubernetes 的架构问题之ACK/ASK支持ECI的Serverless Container如何解决
Kubernetes 的架构问题之ACK/ASK支持ECI的Serverless Container如何解决
110 7

相关产品

  • 容器服务Kubernetes版
  • 下一篇
    开通oss服务