开发者社区 问答 正文

Swarm 集群  监控  弹性伸缩不起作用怎么办

如果您创建的容器弹性伸缩或节点弹性伸缩不起作用,您可以按照以下内容来进行问题排查。

查看监控指标,确认监控指标有数据并达到阈值一段时间。

  • 查看容器弹性伸缩的监控指标
    1. 单击左侧导航栏中的服务。
    2. 选择服务所在的集群。
    3. 选择所需的服务并单击监控。
      页面跳转到云监控管理控制台,您可以查看容器的监控信息。你需要确认监控指标有数据并达到阈值一段时间。

Note
容器服务在判断监测指标是否超出所设定的上下限时,使用的是采集周期(一分钟)内监测指标的平均值(即 CPU 平均使用量和内存平均使用量),而且只有当连续三个采集周期内的监测指标平均值均超出所设定的上下限时,容器服务才会触发扩容或伸缩操作,以避免因为监控数据抖动而引起频繁的扩容或缩容操作。


[font=PingFangSC, "]查看节点弹性伸缩的监控指标 [font=PingFangSC, "]
  1. 单击左侧导航栏中的集群。
  2. 选择所需的集群,单击监控。
    进入云监控管理控制台,您可以看到集群的监控信息。你需要确认监控指标有数据并达到 阈值一段时间。


Note容器服务在判断监测指标是否超出所设定的上下限时,使用的是采集周期(一分钟)内监测指标的平均值(即 CPU 平均使用量和内存平均使用量),而且只有当连续三个采集周期内的监测指标平均值均超出所设定的上下限时,容器服务才会触发扩容或伸缩操作,以避免因为监控数据抖动而引起频繁的扩容或缩容操作。


如果没有监控数据您需要查看监控服务(acsmonitoring)是否正确安装(容器状态及数量是否正确),查看集群 Agent 是否为最新版本, 监控服务(acsmonitoring)是否为最新版本;如果不是,请进行升级。参见 升级系统服务升级 Agent

查看监控报警规则及状态,确认规则生成且状态正确

  1. 在云监控管理控制台,单击左侧导航栏中的云服务监控 > 容器服务。
    您可以看到集群列表。

  2. 单击查看全部规则,可以看到弹性伸缩自动设置的报警规则。





单击 报警历史。您可以选择时间来查看指定时间段内发生的报警。

展开
收起
青蛙跳 2018-08-31 21:26:14 1552 分享 版权
阿里云 AI 助理回答

如果您的容器弹性伸缩或节点弹性伸缩未按预期工作,可以遵循以下步骤进行排查:

  1. 监控指标验证:

    • 容器服务监控: 进入集群管理控制台,选择具体服务查看其监控信息。确保相关监控指标(如CPU使用率、内存使用量)不仅有数据记录,并且已持续达到触发伸缩的阈值一段时间。请注意,容器服务基于一分钟采集周期内的平均值判断指标是否超出设定上下限,并要求连续三个周期达标才执行操作,以减少因数据波动导致的频繁扩缩容。
    • 节点服务监控: 同样,在集群监控界面检查集群层面的监控信息,确认监控指标同样达到并保持在阈值水平。
  2. 检查监控配置:

    • 确认监控服务acsmonitoring正确安装且版本是最新的。这包括检查容器状态及数量是否准确,以及集群Agent和监控服务本身是否已升级到最新版本。如有需要,参考相关文档进行[升级系统服务]和[升级Agent]。
  3. 报警规则检查:

    • 在云监控管理控制台,导航至云服务监控下的容器服务部分,查看自动设置的报警规则列表。确保所有相关的报警规则已经生成,并且状态无误。
    • 查看报警历史,通过选择特定时间段来分析是否有报警被触发,以及这些报警与实际资源需求变化是否相符。这有助于识别是否存在报警响应机制的问题。

综上所述,问题排查应从监控数据的有效性、监控组件的正确配置,以及报警规则的有效性和执行情况三个方面入手,逐一核对并解决潜在问题点,以恢复弹性伸缩功能的正常运作。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答