设置阿里云服务器ECS的监控与报警功能可以按照以下步骤进行:
准备工作
- 检查监控插件:确保ECS监控插件运行正常,以保证监控信息能够正常采集。若安装失败,需手动安装插件,具体操作可参考云监控插件安装指南。
- 添加报警联系人和联系组:登录阿里云控制台,在右上角搜索框输入“云监控”,选择“控制台>云监控”,进入后点击左侧菜单“报警服务>报警联系人”,点击“创建联系人”,填写手机和邮箱信息,以便接收报警通知。
设置报警规则
- 登录ECS管理控制台:打开浏览器,访问阿里云官方网站,使用账号凭据登录。在控制台首页找到服务列表或搜索框,搜索“ECS”或在“产品”类别下找到“云服务器ECS”,点击进入。
- 选择目标实例:在ECS实例列表中,通过筛选、标签或分组功能找到要设置监控与报警的实例,单击实例ID进入实例详情页。
- 开启一键报警(可选):在实例详情页的“监控”页签下,点击“报警规则”页签,然后点击“一键报警”。在弹出的面板上,开启该功能。此方式会创建CPU使用率、磁盘使用率、内存使用率、网络带宽使用率相关报警规则,且对阿里云账号下所有的ECS实例生效。
- 设置自定义报警规则(推荐):在“监控”页签下的“报警规则”页签中,点击“创建报警规则”,在弹出的面板中根据页面提示进行设置。具体配置项如下:
- 规则描述:添加报警规则,包括报警规则名称和报警规则主体。例如,设置CPU使用率5分钟平均值>=90%,持续3个周期,则报警服务每5分钟检查一次数据是否满足平均值>=90%,只检测3次。
- 通道沉默周期:指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
- 生效时间:指报警规则的有效时间段,若不指定则全天生效。
- 报警联系人组:选择之前创建的报警联系人组。
- 报警回调(可选):填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。
查看和管理报警规则
设置完成后,可以在报警规则列表中查看已创建的规则,并对其进行修改、复制、禁用或删除等操作。当指标满足报警条件时,会通过配置的报警渠道(如手机短信、邮箱、钉钉等)接收到告警信息,也可以在云监控控制台查看报警的历史信息。