开发者社区> 问答> 正文

如何进行监控?

如何进行监控?

展开
收起
小天使爱美 2020-03-25 18:28:21 764 0
1 条回答
写回答
取消 提交回答
  • 合理的监控设置能极大减轻云上业务的运维成本和压力。设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。 前提条件 在开始设置云监控前,您需要完成以下操作:

    已注册阿里云账号。如还未注册,请先完成账号注册。
    检查ECS监控插件运行情况,确保监控信息能够正常采集。如果安装失败需要手动安装,请参见云监控插件安装指南。
    提前添加报警联系人和联系组,建议设置至少2人以上的联系人,互为主备,以便及时响应监控告警。监控选项的设定,具体请参见报警联系人/报警联系组管理和云服务资源使用概览和报警概览。
    

    背景信息

    利用云监控的Dashboard功能,给您业务系统的云资源设置一个全局监控总览,可随时检查整个业务系统资源的健康状态。 为了更好地监控大屏展示效果,这里将ECS的CPU、内存、磁盘的使用率单独分组展示;将RDS的四项指标分两组展示。 指标展示效果图 本文中以一个网站为示例,介绍如何配置使用云监控。本示例中,使用了ECS、RDS、OSS和负载均衡。架构图 设置报警阈值和报警规则

    建议您根据实际业务情况设置各项监控指标的报警阈值。阈值太低会频繁触发报警,影响监控服务体验。阈值太高,在触发阈值后没有足够的预留时间来响应和处理告警。 以CPU使用率为例,因为需要给服务器预留部分处理性能保障服务器正常运行,所以建议您将CPU告警阈值设置为70%,连续三次超过阈值后开始报警。设置CPU告警阈值 如果您还需要设置其他资源的报警规则,单击添加报警规则,继续设置内存或磁盘的报警规则和报警通知人。示例如下:

    设置RDS监控
    
    建议将RDS的CPU使用率报警阈值设置为70%,连续三次超过阈值后开始报警。您可以根据实际情况设置硬盘使用率、IOPS使用率、连接数等其他监控项。监控项的详细介绍请参见监控项。
    设置RDS监控
    设置负载均衡监控
    为了更好使用负载均衡的云监控服务,您需要先开启负载均衡的健康检查,将负载均衡带宽值的70%作为告警阈值,如下图所示。设置负载均衡监控
    

    设置进程监控 对于常见的web应用,设置进程监控,不仅可以实时监控应用进程的运行情况,还有助于排查处理故障,下图是Java进程的相关监控示例。具体操作请参见添加进程监控。设置进程监控 设置站点监控

    在云服务器外层的监控服务,站点监控主要用于模拟真实用户访问情况,实时测试业务可用性,有助于排查处理故障。 设置站点监控

    如果以上监控选项不能满足您的实际业务监控需求,您可以使用自定义监控。详情请参见自定义监控概览。

    2020-03-25 18:41:25
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
基于日志trace的智能故障定位系统 立即下载
智能告警:IT系统神经中枢 立即下载
阿里云应用性能管理(APM)产品-应用实时监控服务(ARMS 立即下载