使用运维编排订阅ECS快照创建失败通知

简介: ### 背景 [ECS事件通知](https://help.aliyun.com/document_detail/116628.html)代表了ECS资源的状态变更。云监控提供了事件通知订阅的功能,用户可以通过[设置事件通知](https://help.aliyun.com/document_detail/116341.html)来订阅短信、邮件或者钉钉通知。也可以将事件消息转发到消息队列或

背景

ECS事件通知代表了ECS资源的状态变更。云监控提供了事件通知订阅的功能,用户可以通过设置事件通知来订阅短信、邮件或者钉钉通知。也可以将事件消息转发到消息队列或者日志文件中,通过SDK来进行程序化消费。

云监控尚未支持根据事件详情中的内容进行事件过滤。比如完成创建快照事件,如果用户只想接收创建快照失败的通知,目前还做不到。

运维编排(OOS)的事件运维功能是集成了云监控的事件报警能力和运维编排的自动化能力,可以实现托管的事件驱动运维。使用事件运维功能可以实现上述的事件过滤并通知的功能,实际上这只是最简单的事件运维场景。

配置步骤

配置权限和创建角色

首先,需要给运维编排服务设置RAM权限并创建OOS扮演的角色。如果使用子账户登录运维编排控制台,要给子账户授予合适的权限,请参考官方文档

由于事件运维任务是7x24小时持续执行的,所以配置角色是必须的,请参考官方文档

创建一个发送通知的模板

运维编排的运维任务是以模板的形式保存的,模板为json/yaml格式。我们先创建一个发送通知的模板。

Description: Create snapshot fail notification.
FormatVersion: OOS-2019-06-01
Parameters:
  diskId:
    Type: String
    Description:
      en: The disk id.
      zh-cn: 磁盘ID。
Tasks:
  - Name: NotifyDingtalk
    Action: 'ACS::Notify'
    Properties:
      NotifyType: WebHook
      WebHook:
        URI: 'https://oapi.dingtalk.com/robot/send?access_token=xxx'
        Headers:
          Content-Type: application/json
        Content:
          msgtype: text
          text:
            content: '创建快照失败,磁盘ID {{diskId}}'
          at:
            atMobiles:
              - '18688888888'

URI为钉钉机器人的地址,atMobiles是需要在钉钉消息中@的钉钉账号的手机号。

如需发送邮件,参照官网文档对ACS::Notify的参数进行修改

Tasks:
  - Action: ACS::Notify
    Name: testNotifyByMail
    Properties:
        NotifyType: Mail
        Mail:
            Host: SMTPHostAddress # SMTP 服务器主机地址 如 smtp.example1.com
            Port: SMTPPort # SMTP 服务器端口 如 465
            Username: sender  # 代发送的邮箱用户 如 usr001@example1.com
            Password: senderPassword # 代发送的邮箱密码 如 123456zxcv
            Subject: mailSubject # 邮件主题 如 hello world
            Body: mailBody # 邮件正文 如 hello world !!!
            From: senderAddress # 邮件来自 如 usr001@example1.com
            To:  receiverAddresses    # 收件人邮箱地址列表 如 [usr1234@example2.com,usr123@example2.com]

创建一个事件运维任务

登录运维编排控制台,选择告警与事件运维,触发类型选择系统事件,配置触发规则:
Jietu20200616-211833.png

选择上面创建的钉钉通知模板:
Jietu20200616-210256.png

设置执行模板的参数,可以使用事件消息体中的字段作为钉钉通知模板的入参:
Jietu20200616-210318.png
立即执行。

我们看看通知的效果,当一个快照创建失败时,收到了一个钉钉机器人提醒:
Jietu20200616-2119112.png

探索运维编排的其他功能

以上只是运维编排的一个基本应用,运维编排支持多种常用运维任务,比如更新镜像、批量执行命令,以及定时运维、告警运维、事件运维等等。用户可以使用控制台执行这些常用任务,也可以一键执行一个公共模板。运维编排对接了60款云产品的OpenAPI,支持在用户GuestOS执行自定义命令,还有丰富的原子动作、云产品动作和强大的流程控制能力。如果有定制化的需求,可以编写自己的模板来实现。

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
弹性计算 人工智能 运维
摆脱繁琐命令-让运维更加流畅-阿里云ECS操作系统控制台运维篇
阿里云操作系统控制台提供了便捷的服务器监控与管理功能,简化了运维工作。通过将多台服务器纳入统一监控平台,用户可以快速查看CPU、内存、磁盘和网络等关键资源的使用情况,避免了逐一远程连接查询的繁琐操作。此外,该工具支持自动化数据汇总,极大地方便了日报、周报和月报的编写。测试过程中,系统展示了良好的稳定性和响应速度,尤其在网络抖动和大文件健康状态测试中表现出色。整体体验流畅,显著提升了运维效率。 操作系统控制台地址:[点击访问](https://alinux.console.aliyun.com/)
117 26
摆脱繁琐命令-让运维更加流畅-阿里云ECS操作系统控制台运维篇
|
3月前
|
机器学习/深度学习 人工智能 运维
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
150 14
|
5月前
|
弹性计算 Ubuntu Linux
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS自动化部署。支持Ubuntu 22.04/20.04、CentOS 7.7-7.9及Alibaba Cloud Linux 3.2104 LTS。前提条件:ECS实例需运行中且有公网。步骤:选择Docker扩展并安装,验证成功通过命令`docker -v`查看版本号。
485 79
|
3月前
|
运维 安全 开发工具
GitHub 热门开源运维工具 Websoft9:如何实现服务器管理效率翻倍?
Websoft9 提供 200+ 开源应用一键部署,支持容器化隔离、GitOps 自动化和企业级安全防护,助力服务器管理效率提升 80%。
121 1
|
5月前
|
存储 固态存储 应用服务中间件
阿里云服务器租赁价格:实例配置、预留实例券、块存储、带宽、快照最新收费标准
阿里云服务器收费项目有实例价格、预留实例券、专有宿主机、块存储价格、存储容量单位包、带宽价格和快照服务价格,收费模式有包年包月和按量付费模式。2025年阿里云继续推出各种云服务器优惠,本文为大家汇总了2025年阿里云服务器各个收费项目的最新收费标准与云服务器的最新活动价格,以供参考和了解。
526 24
|
3月前
|
机器学习/深度学习 人工智能 运维
基于AI的自动化服务器管理:解锁运维的未来
基于AI的自动化服务器管理:解锁运维的未来
389 0
|
5月前
|
运维
阿里云服务器批量执行命令(系统运维管理oos)
阿里云【系统运维管理oos】批量执行详情
125 5
|
5月前
|
弹性计算 运维 Ubuntu
使用阿里云服务器自动搭建WordPress网站流程,超简单by系统运维管理OOS
本教程介绍如何使用阿里云服务器(ECS)和系统运维管理OOS自动搭建WordPress网站,支持Ubuntu、CentOS及Alibaba Cloud Linux等操作系统。前提条件包括ECS实例处于运行中、有公网IP且安全组已开启80端口。安装步骤简单:进入ECS快速购买控制台选择预装WordPress,确认下单后通过管理控制台查看实例详情并开放安全组端口。最后,通过实例公网IP访问,出现WordPress登录页即表示安装成功。
|
6月前
|
运维 网络安全 Python
自动化运维:使用Ansible实现批量服务器配置
在快速迭代的IT环境中,高效、可靠的服务器管理变得至关重要。本文将介绍如何使用Ansible这一强大的自动化工具,来简化和加速批量服务器配置过程。我们将从基础开始,逐步深入到更复杂的应用场景,确保即使是新手也能跟上节奏。文章将不包含代码示例,而是通过清晰的步骤和逻辑结构,引导读者理解自动化运维的核心概念及其在实际操作中的应用。
|
6月前
|
运维 Ubuntu 网络协议
自动化运维:使用Ansible进行服务器配置管理
在现代IT架构中,自动化运维已成为提升效率、减少人为错误的关键。本文将介绍如何使用Ansible这一强大的自动化工具来简化和标准化服务器的配置管理过程。通过具体的代码示例和操作步骤,我们将展示如何快速部署应用、管理配置以及自动化日常任务,从而确保环境的一致性和可靠性。

热门文章

最新文章