开发者社区 > 云原生 > 容器服务 > 正文

容器服务ACK这种eci 调度卡住的情况 有人遇到过么?

容器服务ACK这种eci 调度卡住的情况 有人遇到过么?lQLPJw0phrxy7v_MvM0EqbA7IUXkYDdATwWGLLB1qfUA_1193_188.png

展开
收起
三分钟热度的鱼 2024-01-10 13:49:24 62 0
3 条回答
写回答
取消 提交回答
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    确实,在使用阿里云容器服务ACK和其弹性容器实例ECI时,调度问题是一个常见的挑战。如果当前集群的ECS资源不足,调度系统会尝试使用ECI弹性资源来满足Pod运行的需求。然而,如果在此过程中出现问题,例如eci抢占式调度经常失败,这可能导致Pod无法成功创建。

    为了解决这个问题,您可以采取以下步骤:

    1. 检查当前集群的ECS资源是否充足。如果资源不足,您可能需要调整资源配置或者扩容以提供足够的资源供Pod运行。

    2. 检查您的调度策略设置。在ACK集群中部署服务时,您可以使用容忍度和节点亲和性来声明只使用ECS或ECI弹性资源,或者是在ECS资源不足时自动申请ECI资源。根据工作负载的不同,合理配置这些参数可能会帮助解决调度问题。

    3. 如果您已经确认了上述设置并无问题,那么可能需要考虑查看Pod的状态以及日志信息,以便找出具体的问题原因。

    2024-01-13 15:49:33
    赞同 展开评论 打赏
  • 是的,有些用户在使用阿里云容器服务ACK时可能会遇到ECI(弹性容器实例)调度卡住的情况。例如,当创建ECI Pod后,Pod可能长期处于Pending状态,这通常是因为实例与API Server之间的网络不通或者因为集群的可用资源不足。此外,如果在ACK+Virtual Node的环境下,kube-proxy或coredns被调度到了虚拟节点,但启动失败,也可能是由于配置不当所致。

    为了解决这类问题,可以尝试以下方法:

    1. 检查Pod是否与集群的API Server位于同一专有网络VPC中,确保它们能够正常通信。

    2. 如果集群有访问控制策略,确认Pod的网络段是否已被添加到访问控制列表中,以允许其对集群的访问。

    3. 对于ACK+Virtual Node的情况,编辑kube-proxy和coredns的YAML文件,排除对虚拟节点的调度,这样可以防止它们被误调度到虚拟节点上。

    4. 联系阿里云技术支持,提供更多详细信息,以便获得针对性的帮助。

    5. 查看阿里云官方文档,了解ECI的创建、调度和使用过程中的注意事项及常见问题解决方案。

    6. 使用阿里云提供的云监控和云日志服务,对ECI实例进行监控和日志收集,以便于问题定位和分析。

    7. 遵循阿里云的最佳实践和建议,优化ECI的使用和部署,提高其稳定性和性能。

    2024-01-13 09:38:33
    赞同 展开评论 打赏
  • Log看看init 日志 多半是初始化失败了。此回答整理自钉群“容器服务ACK 用户交流-1群”

    2024-01-10 16:24:12
    赞同 展开评论 打赏

国内唯一 Forrester 公共云容器平台领导者象限。

相关产品

  • 容器服务Kubernetes版
  • 相关电子书

    更多
    公共云弹性计算最佳实践-省钱窍门之四:弹性容器实例和Serv 立即下载
    基于ECI的ACK集群高弹性架构 立即下载
    《边缘容器服务ACK@Edge》 立即下载

    相关镜像