运维编排场景系列-----自动从负载均衡移除停止的ECS实例

本文涉及的产品
云服务器ECS,u1 2核4GB 1个月
云服务器 ECS,u1 4核8GB 1个月
云服务器 ECS,u1 2核4GB 3个月
简介: 挂载在负载均衡上的ECS实例,存在被意外停止的可能性,若实例意外停止后没有得到及时处理,负载均衡上一直挂载着异常状态的实例,或被动地等待负载均衡的处理异常,这种情况肯定不是我们想要的。 通过运维编排服务中事件触发器动作可对您运行中实例进行监控,一旦实例进入停止状态,则立刻进行一些逻辑处理,确保异常实例及时移除。

场景简介

挂载在负载均衡上的ECS实例,存在被意外停止的可能性,若实例意外停止后没有得到及时处理,负载均衡上一直挂载着异常状态的实例,或被动地等待负载均衡的处理异常,这种情况肯定不是我们想要的。
通过运维编排服务中事件触发器动作可对您运行中实例进行监控,一旦实例进入停止状态,则立刻进行一些逻辑处理,确保异常实例及时移除。

解决方案

  • 步骤拆分

    1. 对ECS实例通过OOS的事件触发器进行有效监控,保证实例中断事件发生后及时得到处理。
    2. 检查中断的实例是否为当前负载均衡上的,保证后续任务只针对该负载均衡上的中断实例执行。
    3. 将中断实例从负载均衡后端服务器列表移除,主动剔除问题实例。
  • 模版内容(YAML格式)
---
FormatVersion: OOS-2019-06-01
Description: Remove ECS Instance from SLB when Instance Status is Stopped.
Parameters:
  regionId:
    Description: The Region Id of SLB and Instance.
    Type: String
    MinLength: 1
    MaxLength: 30
  OOSAssumeRole:
    Description: The RAM role to be assumed by OOS.
    Type: String
    Default: OOSServiceRole
  loadBalancerId:
    Description: The ID of the SLB instance.
    Type: String
    AllowedPattern: lb-[A-Za-z0-9]*
    MaxLength: 30
    MinLength: 1
RamRole: '{{OOSAssumeRole}}'
Tasks:
  - Name: whenInstanceStopped
    Action: 'ACS::EventTrigger'
    Properties:
      Product: ECS
      Name:
        - 'Instance:StateChange'
      Content:
        state:
          - Stopped
    Outputs:
      instanceId:
        ValueSelector: content.resourceId
        Type: String
  - Name: checkNeedRemoveOrNot
    Action: ACS::CheckFor
    Description: check the interrupted Instance is being added on SLB or Not.
    OnError: ACS::END
    OnSuccess: ACS::NEXT
    Properties:
      Service: SLB
      API: DescribeLoadBalancerAttribute
      Parameters:
        RegionId: '{{ regionId }}'
        LoadBalancerId: '{{ loadBalancerId }}'
      DesiredValues:
        - "{{whenInstanceStopped.instanceId}}"
      PropertySelector: 'BackendServers.BackendServer[].ServerId|select(.=="{{whenInstanceStopped.instanceId}}")'

  - Name: setEcsOnBackendServers
    Action: ACS::ExecuteApi
    Description: Sets ECS instances no weight on backend servers.
    Properties:
      Service: SLB
      API: SetBackendServers
      Parameters:
        RegionId: '{{ regionId }}'
        BackendServers:
            - ServerId: '{{ whenInstanceStopped.instanceId }}'
              Weight: 0
        LoadBalancerId: '{{ loadBalancerId }}'
    Outputs:
      backendServer:
        Type: List
        ValueSelector: BackendServers.BackendServer[]

  - Name: removeEcsFromBackendServers
    Action: 'ACS::ExecuteApi'
    Description: Remove ECS instances to backend servers.
    Properties:
      Service: SLB
      API: RemoveBackendServers
      Parameters:
        RegionId: '{{ regionId }}'
        LoadBalancerId: '{{ loadBalancerId }}'
        BackendServers:
          - ServerId: '{{ whenInstanceStopped.instanceId }}'
            Weight: 0
    Outputs:
      backendServer:
        Type: List
        ValueSelector: BackendServers.BackendServer[]

操作指南

  1. 首先登录到运维编排控制台 。
  2. 单击 自定义模版 ,单击 创建模版 。
  3. 单击 YAML 。
    将编写好的YAML格式模版内容粘贴到编辑框内,或者您也可直接在编辑框中编写该模版。1568169207698_4ab6dc1d_88f6_444e_b487_d99f98d795c1
  4. 单击 校验模版。 

    • 若模板内容已通过校验,继续下一步。
    • 若模板内容校验失败,请根据提示内容调整模版。
  5. 填写 模版名称。
    本文此处填写"remove_interrupted_instance_from_slb1" 。0cbf_4ff7_8889_831841db777a
  6. 单击 创建模版 。
    自定义模版列表中可通过模版名称快速找到该模版。
  7. 单击 创建执行 。
  8. 风险确认模式 选择 客户了解风险,无需确认 。
    e50b_4245_b9eb_2d03706cdfcc
  9. 单击 下一步,设置参数 。

    • regionId :将要操作的实例及负载均衡所在的Region。
    • loadBalancerId:当该负载均衡上有ECS实例停止时,将从该负载均衡的后端服务器列表上移除停止的ECS实例。
      44a6_4eb7_b84e_4850c4f35c3d
  10. 单击 下一步,确认创建 ,单击 创建执行 。
    执行管理中可查看刚刚创建的执行,若创建执行成功,且执行状态处于等待中,则表示ECS实例已开始被监控,一旦有该负载均衡上的ECS实例被停止,则会触发whenInstanceStopped任务后面的任务执行,该ECS实例会被自动从负载均衡上移除。c2_9b5a1526b81b
  11. 那么我们验证下,验证前,在该负载均衡上需要有一个已挂载且正常运行的ECS实例。
    _80f1_460a_b5a7_901ed479af62c04_8a27_286684d4b47b
  12. 停止负载均衡上正常运行的ECS实例。
    40c6_b042_088ba479ad2c
  13. 负载均衡挂载的ECS实例已停止。
    48_999c_2a256965119c
  14. 当该ECS实例已停止时,该模版执行中whenInstanceStopped任务下面的任务会被触发,且执行状态从等待中变为运行中,即触发了自动从负载均衡移除已停止的ECS实例。
    8cb21ab2506d
  15. 现在我们在该负载均衡服务器列表中查询该实例Id,发现服务器列表中已经没有了该台ECS实例,表示自动移除成功。
    a_4dd3_975e_fe9e9f925b8e
相关实践学习
ECS云服务器新手上路
本实验会自动创建一台ECS实例。首先,远程登陆ECS实例,并部署应用。然后,登陆管理控制台,并对这台ECS实例进行管理操作。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
2天前
|
存储 弹性计算 人工智能
阿里云服务器五代、六代、七代、八代实例区别及选择参考
目前阿里云服务器的实例规格经过多次升级之后,最新一代已经升级到第八代实例,当下主售的云服务器实例规格也以七代和八代云服务器为主,对于初次接触阿里云服务器实例规格的用户来说,可能并不是很清楚阿里云服务器五代、六代、七代、八代实例有哪些,他们之间有何区别,下面小编为大家介绍下阿里云五代、六代、七代、八代云服务器实例规格分别有哪些以及每一代云服务器在性能方面具体有哪些提升,以供大家参考和了解。
阿里云服务器五代、六代、七代、八代实例区别及选择参考
|
4天前
|
存储 机器学习/深度学习 编解码
阿里云服务器计算型c8y实例简介:收费标准、性能及与计算型c7区别参考
在我们通过阿里云的各种活动来选择计算型实例规格的云服务器时,通常有计算型c7和c8y实例可供选择,计算型c8y属于阿里云的倚天云服务器系列,采用阿里云自研倚天710 ARM架构CPU,依托第四代神龙架构,提供稳定可预期的超高性能。同时通过芯片快速路径加速手段,完成存储、网络性能以及计算稳定性的数量级提升。本文为大家介绍一下计算型c8y实例最新收费标准、性能介绍及与计算型c7区别参考。
阿里云服务器计算型c8y实例简介:收费标准、性能及与计算型c7区别参考
|
2天前
|
存储 弹性计算 大数据
阿里云ECS在大数据处理中展现高效存储与计算实力,提供多样化实例规格适应不同需求
【7月更文挑战第3天】阿里云ECS在大数据处理中展现高效存储与计算实力,提供多样化实例规格适应不同需求,如大数据型实例配备高吞吐硬盘。与OSS集成实现大规模存储,通过Auto Scaling动态调整资源,确保任务高效运行。案例显示,使用ECS能提升处理速度、降低成本,为企业数据驱动创新提供有力支持。
22 1
|
5天前
|
机器学习/深度学习 人工智能 数据处理
人工智能平台PAI产品使用合集之PAI-DSW实例服务器ping不通google.com,该如何排查
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
弹性计算 负载均衡 测试技术
运维编排系列场景--跨可用区批量克隆ECS实例
背景可用区(Availability Zone,简称 AZ)是指在同一地域内,电力和网络互相独立的物理区域。例如,华北1(青岛)地域支持2个可用区,包括青岛 可用区B和青岛 可用区C。同一可用区内实例之间的网络延时更小,其用户访问速度更快。将应用部署在多个可用区可以提高应用的可用性,降低故障风险。然而,在实际应用中,有时需要将实例从一个可用区迁移到另一个可用区,以实现故障切换、负载均衡、数据备份与
571 0
运维编排系列场景--跨可用区批量克隆ECS实例
|
弹性计算 运维 数据中心
运维编排系列场景--跨账号跨地域实例操作系统补丁修复
运维编排(OOS) 简介什么是OOSOperation Orchestration Service,简称OOS,是全面、免费的云上自动化运维平台,提供运维任务的管理和执行。典型使用场景包括:事件驱动运维,批量操作运维,定时运维任务,跨地域运维等,OOS为重要运维场景提供审批,通知等功能。OOS帮您实现标准化运维任务,从而实践运维即代码(Operations as Code)的先进理念。关于OOS更
413 0
|
弹性计算 运维 监控
运维编排系列场景--通过告警触发自动重启CPU使用率高的ECS实例
运维编排(OOS) 简介什么是OOSOperation Orchestration Service,简称OOS,是全面、免费的云上自动化运维平台,提供运维任务的管理和执行。典型使用场景包括:事件驱动运维,批量操作运维,定时运维任务,跨地域运维等,OOS为重要运维场景提供审批,通知等功能。OOS帮您实现标准化运维任务,从而实践运维即代码(Operations as Code)的先进理念。关于OOS更
201 0
|
弹性计算 运维 监控
运维编排系列场景--使用定时运维进行状态逼近
### 面向终态的运维 阿里云运维编排服务(Operation Orchestration Service,简称OOS),是阿里云提供的云上自动化运维服务,能够自动化管理和执行任务。OOS支持定时运维功能,可以周期性重复执行指定的运维任务。基于定时运维,OOS能够对云资源的状态进行管理,实现面向终态的运维。 本文以[ilogtail](https://help.aliyun.com/d
3554 0
运维编排系列场景--使用定时运维进行状态逼近
|
弹性计算 运维 网络安全
运维编排系列场景--批量管理自定义的软件包
运维编排(OOS) 简介 什么是OOS Operation Orchestration Service,简称OOS,是全面、免费的云上自动化运维平台,提供运维任务的管理和执行。典型使用场景包括:事件驱动运维,批量操作运维,定时运维任务,跨地域运维等,OOS为重要运维场景提供审批,通知等功能。OOS帮您实现标准化运维任务,从而实践运维即代码(Operations as Code)的先进理念。关于
1481 0
运维编排系列场景--批量管理自定义的软件包
|
弹性计算 运维 监控
运维编排系列场景-----在磁盘使用率超限时自动清理临时文件
### 场景介绍 有些应用在运行过程中会不断产生文件,比如下载的文件、备份文件、日志文件,我们需要在磁盘使用率过高后删除不再使用的或者过期的文件。这里我们以清理/tmp下的临时文件为例,说明如何通过运维编排(OOS)提供的公共模板来实现此类运维操作。 ### 解决方案 我们准备一台ECS实例,登陆进系统后,查看它的磁盘占用率: ![磁盘占用2.png](https:
680 0

热门文章

最新文章